一个立一个羽念什么字-绿茶通用站群

一个立一个羽念什么字 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊(liáo)天机(jī)器(qì)人ChatGPT火爆(bào)以来，微软公司创始人比尔(ěr)·盖茨已(yǐ)多次公开(kāi)谈论人工智能话题。在最(zuì)近的一次采访中，他(tā)再次表示：“AI可(kě)能会(huì)让科技行业(yè)迎来一(yī)次(cì)剧(jù)烈(liè)的洗牌”。

这个(gè)结论是(shì)他在当地(dì)时间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预期，AI的发展可能(néng)会威胁到谷歌的市占率，因为(wèi)微软在AI方面(miàn)的行动(dòng)相(xiāng)当迅(xùn)速。而最终科技巨头将把AI整合成用户的“全能助手”，包揽(lǎn)一(yī)切应用，与(yǔ)人们进行(xíng)沟(gōu)通并提(tí)供建议，可以取代(dài)亚马逊、Siri或Outlook等应(yīng)用(yòng)。

大佬口(kǒu)中全能助手的到来(lái)可能尚需时(shí)日，但由ControlNet引发的(de)又一次AI绘画(huà)浪潮，让AIGC在ChatGPT的话题热点(diǎn)包围中杀出重围。

ChatGPT之后又一应用杀疯了(le)，AIGC或进入(rù)可控期(qī)，将(jiāng)洗(xǐ)牌科(kē)技行业？_黑料正(zhèng)能(néng)量

ControlNet颠覆AI绘画新玩(wán)法

AIGC向可(kě)控(kòng)靠(kào)近

以AI绘画(huà)为代表的AIGC上(shàng)一次(cì)爆火的时候，还是2022年8月(yuè)，在美国科(kē)罗(luó)拉多州举办(bàn)的新(xīn)兴数字艺(yì)术家竞赛中(zhōng)，一(yī)幅(fú)名为(wèi)《太空歌剧院》的作品获(huò)奖。

随后各(gè)大厂商的AI绘画(huà)软件被广(guǎng)大网友熟(shú)知并体验，Stable Diffusion便(biàn)是其中代表(biǎo)。

用户们可以(yǐ)在应用中输入一(yī)组关键词(cí)或者一(yī)张照片，就能获得一幅AI创(chuàng)作的画作(zuò)。

作(zuò)画的关键就是所(suǒ)输入(rù)的文本。同一组关键词也可以创作出很(hěn)多张风格不一(yī)样的(de)画作，这让(ràng)创(chuàng)作的(de)过程(chéng)就(jiù)像开盲(máng)盒。

很多用(yòng)户很喜欢这种(zhǒng)不确定的惊喜，他(tā)们会将生成的(de)美图当做头像。而另(lìng)一部(bù)分(fēn)喜欢(huān)翻看AI绘画的(de)“翻车”作品。在(zài)社(shè)交媒(méi)体上，许(xǔ)多(duō)用户(hù)分享(xiǎng)AI“翻车现场”，例如，一(yī)位网友的小狗照片被AI画成了(le)“肌(jī)肉一个立一个羽念什么字男”，还有网友的个(gè)人(rén)照片被AI识别成了建筑。

而(ér)如(rú)今随着ControlNet的出现(xiàn)与(yǔ)加持，以往AI绘画(huà)的填写关键(jiàn)词游戏可能要被颠覆了。

ControlNet是一(yī)位正在斯坦福读博(bó)的中国(guó)人张吕敏创作的(de)一种基(jī)于控制点的图像变(biàn)形算(suàn)法，主要用于数字图像处(chù)理、计(jì)算机视觉和计算机图(tú)形学等领域。

其SD插(chā)件一(yī)经发布，在短短的两天内(nèi)便(biàn)成为了AI绘画领域最(zuì)新的(de)热点。

在此(cǐ)之前，大家用了(le)很多方法想让AI生成的(de)结果尽(jǐn)可(kě)能的(de)符合要求(qiú)，但是都不尽如人意(yì)，它的出现代表着AI生成开始进入真正的可(kě)控时(shí)期。

因(yīn)为ControlNet可以直接提取画面的构图(tú)，人物的(de)姿势(shì)和画面的深(shēn)度信息等。有了(le)它的(de)帮助，就不用频繁的用提示(shì)词来碰(pèng)运(yùn)气，抽盲盒(hé)式的创作了。

通俗的说(shuō)ControlNet相(xiāng)当于(yú)给AI绘(huì)画(huà)加了“魔法”，不少(shǎo)博(bó)主的(de)作(zuò)品已经(jīng)获(huò)得(dé)了大量的浏览量，“viggo”就(jiù)是其中(zhōng)之一(yī)，他用(yòng)朋(péng)友的照片(piàn)直接带她们走进动漫世界。

viggo先(xiān)用StableDiffusion图片转文字。

再用Text2Prompt插(chā)一个立一个羽念什么字件拓展找到(dào)对(duì)应(yīng)的关键词；最(zuì)后用(yòng)ControlNet插件(jiàn)绑(bǎng)定骨骼开始(shǐ)换关键词试(shì)效(xiào)果。

通过图(tú)片就可以(yǐ)看出来(lái)，效果十分(fēn)惊(jīng)艳。

更(gèng)厉害的(de)是，除了真实(shí)的照(zhào)片，草图也可以加上“魔法”，知乎大牛“DevPoint”和“逗砂”介绍(shào)到(dào)ControlNet还能(néng)实现线稿转(zhuǎn)全彩(cǎi)图。大(dà)神(shén)张吕敏其本尊(zūn)也(yě)亲自回(huí)应。

不得不(bù)说(shuō)当下(xià)AIGC已经变得越来越强大(dà)，甚至输出的(de)作品(pǐn)都已(yǐ)经能以假乱真了。

难辨虚实，AIGC技术(shù)力爆(bào)发

警惕安全问题

近日，“苏州金(jīn)鸡湖有游艇party”的消(xiāo)息(xī)火遍(biàn)网络，而(ér)经(jīng)过警方(fāng)辟谣(yáo)这所(suǒ)谓的(de)“party”可能(néng)是全国第一起AI绘图诈骗(piàn)。

由于这个活动里面给出的美女照片都是AI制作的真人照片(piàn)绘(huì)图，因为太逼真，被大家当成真(zhēn)事传播了。

不过仔细观察可以发现(xiàn)，活动发起者提供的照片中有个很(hěn)大的漏洞(dòng)可以发现并非(fēi)真人，而是AI绘(huì)图，那便是图片中女(nǚ)性的手(shǒu)指部分有的(de)存在异(yì)常。

ChatGPT之(zhī)后又一应用杀疯了，AIGC或进入(rù)可控期，将洗牌(pái)科技行业？_黑料正(zhèng)能(néng)量(liàng)

有(yǒu)行业人事表示：“现在因(yīn)为(wèi)手指部分的绘画算法比较复杂，AI还不(bù)太会画人的(de)手，但最新看到的图片已经有越来越完美(měi)的AI模型出(chū)现(xiàn)，以后可能(néng)就完全没有漏洞了。”

类(lèi)似的AI作(zuò)图诈骗在国外也(yě)已有发(fā)生。据英国广播公司报道，土耳其地(dì)震期间，有Tiktok用户使用AI合成(chéng)了儿童受灾的假照片发布到网络，以此诱(yòu)骗善良(liáng)的人打赏(shǎng)“捐助”从而(ér)实施诈(zhà)骗。

目前(qián)随着技术(shù)发展，AIGC已经能做出(chū)真人照片般的绘图(tú)效果，如果这样的图片被(bèi)用来诈骗(piàn)，将非常可怕。

此(cǐ)外AIGC还引发了很多担(dān)忧(yōu)，一方(fāng)面，批判者认为AI在“学习”了大(dà)量前人的作(zuò)品之后(hòu)，其创作没(méi)有任何情绪和灵魂，难以和人(rén)类的艺术创(chuàng)作相提并论。

另一方面，AIGC背后的版权、目(mù)前都并没有(yǒu)得到有(yǒu)效的(de)解决，还(hái)有AIGC会不会代替人类(lèi)“至高无上”的创意(yì)。

马斯(sī)克也(yě)强调，人工智能的安全问题需要得到重视，太晚就来不及了。

AIGC下一站除了视频(pín)，还有远方

技术都是有两面性的，潜在的危害并(bìng)不(bù)能掩盖其光(guāng)辉的贡献。现在看来，人工智能技(jì)术将(jiāng)是第四次工业(yè)革(gé)命的核心驱动力量，将创(chuàng)造新(xīn)的增(zēng)长奇迹。

过去一年(nián)，人工(gōng)智能在技术和商业层面都有了巨大进展(zhǎn)，AI绘画就是人工智(zhì)能技术发(fā)生方(fāng)向性改变的一(yī)个代表(biǎo)。其下一(yī)站或(huò)许就是(shì)视频。

此前(qián)，Meta和(hé)谷歌先(xiān)后发布了几条引爆科(kē)技圈(quān)的(de)短视频。这些视频引发关(guān)注并非内容做(zuò)得多优(yōu)秀，反而(ér)都非常(cháng)简(jiǎn)单，比如一匹正在(zài)喝水的(de)马，一只画画(huà)的玩具熊(xióng)，或者一段骑摩托车的第一视角录像(xiàng)，随便(biàn)一个有(yǒu)手(shǒu)机的人都可(kě)以随手录(lù)下(xià)一段(duàn)。

但(dàn)这些短视频的创作(zuò)方(fāng)式非常简单(dān)，创作者(zhě)仅仅需要(yào)向AI输入一段话(huà)，甚至只是说一下(xià)要求(qiú)，AI就可以根据(jù)需要生(shēng)成一段(duàn)视(shì)频。

谷(gǔ)歌发布(bù)的两个AI生成视(shì)频分别来自于(yú)Imagen Video和Phenaki，前者主(zhǔ)要突(tū)出的是(shì)高(gāo)清，与(yǔ)Meta的Make-A-Video没有(yǒu)太多的(de)差(chà)别。

在(zài)Make-A-Video公(gōng)布了AI生成的(de)视频后(hòu)，AI圈就已经玩了一波(bō)梗，一个能够(gòu)做(zuò)出更高清视频的AI还不足以在短时间(jiān)内戳中兴奋点。

Phenaki更加令(lìng)人震惊(jīng)的(de)地方在于，它可以(yǐ)制作出超过2分钟(zhōng)的连贯的(de)也有确(què)切内容的视频，这才(cái)是真正让人们(men)感到惊喜的地(dì)方。因为无论AI生(shēng)成(chéng)的视频多么高清，也只能是为内容生产(chǎn)者提供一(yī)个灵感(gǎn)，一个素材，一个(gè)过(guò)场(chǎng)动(dòng)画(huà)。

不过能够制作(zuò)出有(yǒu)具体剧(jù)情内(nèi)容的视频就意味着，一些视频创(chuàng)作由(yóu)AI代(dài)替人工完成已经初(chū)步(bù)有(yǒu)了可能。

当(dāng)下AI的发展速度已经超过大部分人的想象。内(nèi)容产(chǎn)业的本质是供给(gěi)创造需求，AIGC作(zuò)为全(quán)新的内(nèi)容生(shēng)产(chǎn)方(fāng)式，可以(yǐ)为内容(róng)产业带(dài)来更新的内容风格、更快的生(shēng)产速(sù)度，更低的生产成(chéng)本，这无疑会驱动内容产业的大爆发。

除了AI绘图、视频(pín)，AIGC技(jì)术还能应用(yòng)于音乐(lè)、代码(mǎ)、机器(qì)人动作(zuò)等多种内容(róng)形式的生成(chéng)。不难发现该项技术不仅(jǐn)在游戏等行业能(néng)得到(dào)有效应用(yòng)，对于下一代互(hù)联网各种元素的构建亦有关键意(yì)义。

从商业化的角度(dù)来看，文(wén)化娱乐、教育、传媒(méi)等诸(zhū)多领域(yù)，本身(shēn)就对基(jī)于AI的可视化内容有强烈需求。

因此，AI绘画及视(shì)频或(huò)不是结果(guǒ)，而只是AI进(jìn)程中的一块(kuài)重要拼图，有望(wàng)在技(jì)术更(gèng)新的加(jiā)持下(xià)实现(xiàn)更大的应用价值(zhí)。

AI从理解内容，走向了可以生成(chéng)内容(róng)，甚至能够创造(zào)出独(dú)立价值和独(dú)立视(shì)角的内容。AIGC的再次出圈，更代表着(zhe)未来的先(xiān)进生(shēng)产力即将到来。

紧抓大模(mó)型与算(suàn)力，牢(láo)固AIGC底座

从技术的发展(zhǎn)也可以看(kàn)出，在语言大(dà)模型(xíng)、图像(xiàng)大(dà)模型之后，多模态大模型已经(jīng)成(chéng)为了新的趋(qū)势。

大模(mó)型被誉为当前人工智能发展的智能底座，是(shì)全(quán)球竞争最激烈的研究方向之一(yī)，包括(kuò)谷(gǔ)歌(gē)、亚马逊、百度、阿里、腾讯(xùn)等众多头部企业(yè)都在竞相发力。

不过训练大模型(xíng)的(de)确价(jià)格不菲，以国(guó)盛(shèng)证券发布的(de)《ChatGPT需要多少算(suàn)力》报告(gào)估算，GPT-3训练一次的成本约为140万美元。而对(duì)于(yú)一些(xiē)更大(dà)的LLM(大型语言模(mó)型)，训练成本(běn)则(zé)介于200万美元(yuán)至1200万美元高价之间(jiān)。

以ChatGPT在2023年1月的独立访客平(píng)均(jūn)数1300万计(jì)算，其对应芯(xīn)片需求为3万多片英伟达A100 GPU，初始投入成本约为8亿美元，每日仅电(diàn)费就在5万美(měi)元左右。

此外不论是ChatGPT还(hái)是(shì)AIGC，都离(lí)不开(kāi)庞大算力支持(chí)。在关注各类大模型的发展同时，更(gèng)应该(gāi)关注算力网络的建设。

算力网络正驱动(dòng)AI产业发展进入史(shǐ)诗级加速进程，让(ràng)AIGC及(jí)通用AI这(zhè)一人工智(zhì)能发展的终极目标离得更近。

因为算(suàn)力可(kě)以对突破(pò)性技术创(chuàng)新提供大力(lì)的支持(chí)。这(zhè)方面，多模态大模型是典型(xíng)。作(zuò)为(wèi)面向未(wèi)来强人工智能、通用人(rén)工智(zhì)能(néng)的(de)重(zhòng)要技术创新，多(duō)模(mó)态大模型已(yǐ)经(jīng)在人工智能领域提(tí)出了很多年，业界(jiè)也有不少技术(shù)突(tū)破，但是(shì)，多模态大模型进(jìn)一步往下走(zǒu)，算力(lì)需求呈几何(hé)式上升，一般的算(suàn)力基(jī)础设施很(hěn)快将难(nán)以(yǐ)胜任。

从图像、文(wén)字、语音单(dān)独(dú)一项的训练(liàn)，到双模态、三模态的跃迁，让人工智能可以灵活应对不同模(mó)态的转化(huà)、像人与世界交互一样(yàng)自然，这方面，由算(suàn)力网络来驱动将有明显优势。

此外，还有很多需(xū)要爆发式增(zēng)长的算力来支撑(chēng)的(de)技(jì)术(shù)创新(xīn)，将在人工智能算(suàn)力网(wǎng)络支(zhī)撑下(xià)快速推(tuī)进(jìn)。

AIGC已经(jīng)露出曙(shǔ)光，期(qī)待在大模型和大算(suàn)力的支(zhī)持下AIGC能持续(xù)颠(diān)覆内容(róng)生产(chǎn)的方式，将(jiāng)创造(zào)的边(biān)际(jì)成本(běn)降低，让(ràng)万众受(shòu)益(yì)。

未经允许不得转载：绿茶通用站群一个立一个羽念什么字