事出有因必有妖下一句怎么回，事出反常必有妖,人若反常必有刀,言不由衷定有鬼-绿茶通用站群

事出有因必有妖下一句怎么回，事出反常必有妖,人若反常必有刀,言不由衷定有鬼 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人(rén)ChatGPT火爆以来，微软公司创始(shǐ)人(rén)比尔·盖茨已多次公开(kāi)谈论人工智(zhì)能话题。在(zài)最近的一次采访中，他再次表示：“AI可能会(huì)让科技行(xíng)业迎(yíng)来一次剧烈的(de)洗(xǐ)牌”。

这个(gè)结(jié)论是他在当地时间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预期，AI的发展可(kě)能(néng)会威胁到(dào)谷(gǔ)歌的市占率，因为微软(ruǎn)在AI方面的行动相当(dāng)迅(xùn)速(sù)。而(ér)最终科技巨头(tóu)将把(bǎ)AI整合成用户的“全能(néng)助手”，包揽(lǎn)一切(qiè)应用，与(yǔ)人们进行沟通(tōng)并提(tí)供建议，可(kě)以(yǐ)取(qǔ)代亚马(mǎ)逊(xùn)、Siri或(huò)Outlook等应用。

大佬口中全能助手的到来可能(néng)尚(shàng)需时日(rì)，但(dàn)由(yóu)ControlNet引(yǐn)发的又一次AI绘画浪潮，让(ràng)AIGC在(zài)ChatGPT的话题热点包围中杀出(chū)重围。

ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗(xǐ)牌科(kē)技行业？_黑料正能量

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的时候，还是(shì)2022年8月，在美(měi)国科(kē)罗拉多州举(jǔ)办(bàn)的新兴数字艺(yì)术家(jiā)竞(jìng)赛中，一幅名为《太(tài)空歌剧院》的(de)作品获奖(jiǎng)。

随后各大厂商的(de)AI绘画软件被(bèi)广(guǎng)大网友熟知并体验(yàn)，Stable Diffusion便是(shì)其(qí)中代(dài)表。

用户们可以在应用(yòng)中输入一组关(guān)键(jiàn)词或者一张照片(piàn)，就能获得一幅AI创作的画(huà)作。

作(zuò)画(huà)的(de)关键就是(shì)所输入的文本(běn)。同一(yī)组关键词也可以创作(zuò)出(chū)很多张风格(gé)不一样的(de)画作，这让(ràng)创作的过(guò)程就(jiù)像开(kāi)盲盒。

很多用户很(hěn)喜欢这种不确定(dìng)的惊喜，他们(men)会将生成(chéng)的美图当做头像。而另(lìng)一部分喜(xǐ)欢(huān)翻看AI绘(huì)画的(de)“翻(fān)车”作品。在社交媒体上，许多用户分(fēn)享AI“翻车现(xiàn)场”，例(lì)如，一(yī)位网友的(de)小(xiǎo)狗照片被AI画成了“肌肉男”，还(hái)有网友的(de)个人照片被AI识别成(chéng)了建筑。

而如今(jīn)随着ControlNet的出现与加持，以往AI绘画的(de)填写关(guān)键词游戏可能(néng)要(yào)被颠(diān)覆了。

ControlNet是一(yī)位正在斯坦(tǎn)福读博的(de)中国人张吕敏创作的一种基(jī)于(yú)控制点的图像变形算法，主要用(yòng)于数字图像处理、计算机视觉和计算(suàn)机图形学(xué)等领域。

其SD插件一经发布，在短短的两(liǎng)天内便成为了(le)AI绘(huì)画(huà)领域(yù)最新的热点。

在此之(zhī)前，大家用了很多方法想让AI生成(chéng)的结(jié)果尽可能的符合(hé)要求(qiú)，但是都不尽如(rú)人意，它的出(chū)现代表着AI生成开始进入(rù)真正的可控时期。

因(yīn)为ControlNet可以直(zhí)接提取画面(miàn)的构图(tú)，人物的姿势和画面的(de)深度信息等。有(yǒu)了它的帮助，就(jiù)不用频繁的用提示(shì)词来碰运(yùn)气，抽盲盒(hé)式的创作了(le)。

通俗(sú)的(de)说ControlNet相当(dāng)于给AI绘(huì)画加(jiā)了“魔法(fǎ)”，不(bù)少博(bó)主的(de)作品(pǐn)已经(jīng)获得了大量的(de)浏览量，“viggo”就是其(qí)中之一，他用(yòng)朋友的(de)照片(piàn)直接带(dài)她们走进动漫世界。

viggo先用StableDiffusion图(tú)片转文字。

再用Text2Prompt插件(jiàn)拓展找(zhǎo)到对应(yīng)的关键词；最后用ControlNet插件绑(bǎng)定骨骼开始换(huàn)关键词试效果。

通过图片就可以看出来，效果十分惊(jīng)艳。

更厉(lì)害的是，除了真实的照片，草图也可以(yǐ)加(jiā)上“魔法(fǎ)”，知乎大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实现线(xiàn)稿转全彩图。大神张吕敏其本尊也亲自回(huí)应。

不得(dé)不说当下AIGC已经变得越来越(yuè)强大(dà)，甚至(zhì)输出的作品都(dōu)已经能以假乱真了(le)。

难辨虚实(shí)，AIGC技术力爆发

警惕(tì)安全问题(tí)

近日(rì)，“苏州金鸡湖有游(yóu)艇party”的消息火遍网络，而经(jīng)过警方辟(pì)谣这所谓的“party”可能是全国(guó)第(dì)一起(qǐ)AI绘图诈骗。

由(yóu)于(yú)这个活动里(lǐ)面给出的美女照片都是AI制作的(de)真人照片绘图(tú)，因为太逼真，被大家当成真(zhēn)事传播了(le)。

不过(guò)仔细观察可以发(fā)现，活动(dòng)发起者提供的照片(piàn)中有个很大的漏洞可以发现并(bìng)非真人，而(ér)是(shì)AI绘图，那(nà)便是图(tú)片(piàn)中(zhōng)女性的(de)手指部分有的存(cún)在异常。

ChatGPT之后又一应用杀疯了，AIGC或进(jìn)入可控期，将洗牌科(kē)技行业？_黑(hēi)料正(zhèng)能量

有行业人事表示：“现在因为(wèi)手指部(bù)分(fēn)的绘画算法比较复杂，AI还不太(tài)会(huì)画(huà)人的(de)手，但最(zuì)新看(kàn)到的图(tú)片已经(jīng)有越来越完美(měi)的AI模型出现，以后可能(néng)就完全没(méi)有漏洞了。”

类(lèi)似(shì)的(de)AI作图诈骗(piàn)在国外(wài)也已有发生。据(jù)英国广播公司(sī)报道，土耳(ěr)其地震期间，有Tiktok用户(hù)使用AI合成了(le)儿童受灾的假(jiǎ)照片发布到网络，以(yǐ)此诱骗善良的(de)人(rén)打(dǎ)赏(shǎng)“捐助”从而实施(shī)诈骗。

目前随(suí)着技术发展，AIGC已经能做出真(zhēn)人照片般的绘图效果(guǒ)，如(rú)果这样的图(tú)片被(bèi)用(yòng)来诈骗，将非常可怕(pà)。

此外AIGC还引发了很(hěn)多担忧(yōu)，一方面，批判者认为AI在“学习”了(le)大量前人的(de)作品(pǐn)之后，其创作(zuò)没(méi)有(yǒu)任(rèn)何情绪和灵魂(hún)，难以(yǐ)和(hé)人类的艺(yì)术(shù)创作相提并论。

另一(yī)方面，AIGC背后(hòu)的(de)版(bǎn)权、目前都(dōu)并没有得到有(yǒu)效的解(jiě)决，还有AIGC会不会(huì)代(dài)替(tì)人类“至高无上”的创意。

马斯克也强调，人(rén)工智(zhì)能的安(ān)全问题需要(yào)得(dé)到重视(shì)，太(tài)晚(wǎn)就(jiù)来不(bù)及了。

AIGC下一站(zhàn)除了视(shì)频，还有远方

技术都是有两面性的，潜在的危害(hài)并(bìng)不能掩盖其光辉的贡献。现在看来，人工智(zhì)能技术将(jiāng)是第四次工业革(gé)命的(de)核心驱动力量，将创造新的增长奇迹。

过(guò)去一年(nián)，人工智(zhì)能在技术和商业层面都有了(le)巨大进展，AI绘(huì)画就是人(rén)工(gōng)智能技(jì)术发生方向(xiàng)性改变的(de)一个代表。其下一站(zhàn)或许(xǔ)就(jiù)是(shì)视频。

此前，Meta和(hé)谷(gǔ)歌先后发布(bù)了几(jǐ)条引(yǐn)爆科技圈的短视频。这些视频引发关(guān)注并非内(nèi)容做得多优(yōu)秀，反(fǎn)而都非(fēi)常简单(dān)，比(bǐ)如一匹正在喝水的马，一(yī)只画画的玩(wán)具(jù)熊，或者一段骑摩托(tuō)车的第一视角(jiǎo)录像，随便一个有手(shǒu)机(jī)的(de)人都可以随(suí)手(shǒu)录下一段(duàn)。

但这些(xiē)短(duǎn)视频的(de)创作(zuò)方式非常简单，创作者仅仅需(xū)要向AI输入(rù)一(yī)段话，甚至只是说一(yī)下要求(qiú)，AI就可以根据(jù)需要生成(chéng)一段视频(pín)。

谷歌发布(bù)的(de)两个(gè)AI生成视频分别来自(zì)于Imagen Video和(hé)Phenaki，前者主要突出的是高清(qīng)，与(yǔ)Meta的Make-A-Video没有太多的差别。

在(zài)Make-A-Video公布了AI生成的视频后，AI圈就(jiù)已经(jīng)玩(wán)了(le)一波梗，一(yī)个能够做出更(gèng)高清视频的AI还不足以在短时间内戳中兴奋(fèn)点(diǎn)。

Phenaki更加(jiā)令人震(zhèn)惊的(de)地方在于(yú)，它(tā)可(kě)以制(zhì)作出(chū)超过(guò)2分钟的连贯(guàn)的也有确切内容(róng)的视频，这才(cái)是(shì)真正让人们(men)感到惊喜的地方。因为无论(lùn)AI生成(chéng)的视频多(duō)么高清，也(yě)只能是为内容(róng)生产者(zhě)提供(gōng)一个灵(líng)感，一个素材，一(yī)个过场动(dòng)画。

不过(guò)能够制作出(chū)有具体剧(jù)情内(nèi)容(róng)的视频就意味(wèi)着(zhe)，一些(xiē)视频创作由AI代替人工完成(chéng)已经初步有了可能。

当下(xià)AI的(de)发展速度已经(jīng)超过(guò)大部分人的想象。内容产业的(de)本(běn)质(zhì)是供给(gěi)创造需求，AIGC作为(wèi)全新的内容生产方式(shì)，可以为内(nèi)容产业带来更新的内容(róng)风(fēng)格、更快的生产速度，更(gèng)低的(de)生产成本，这无疑会驱动内容产业的大爆发。

除了AI绘图(tú)、视频，AIGC技术还能应(yīng)用于音乐、代(dài)码(mǎ)、机(jī)器人动作等(děng)多种内容形式的(de)生(shēng)成。不难发现该项技(jì)术不仅在游戏等行业能(néng)得(dé)到有效应用，对于下一代互联网各种元素的构建亦有关键意义(yì)。

从商业化的角度来看，文化(huà)娱乐、教育、传媒等诸多(duō)领域，本身就对基于AI的可视化(huà)内容有强烈需求。

因此(cǐ)，AI绘画及(jí)视频或(huò)不是结果，而(ér)只是AI进程中的一块重要拼图，有望(wàng)在技术更新的加持下实现更(gèng)大的应用价值。

AI从理解内容，走向了可以生成内容，甚至(zhì)能够创造(zào)出(chū)独立价值(zhí)和独立视角(jiǎo)的内容。AIGC的(de)再次(cì)出(chū)圈，更代表着未来(lái)的先进生(shēng)产力(lì)即(jí)将到来(lái)。

紧抓大(dà)模型与(yǔ)算(suàn)力，牢固AIGC底(dǐ)座

从技(jì)术(shù)的(de)发展也可以看出，在语言大(dà)模(mó)型、图(tú)像大模型之后(hòu)，多模(mó)态大模型(xíng)已经成为了新的趋势。

大(dà)模型被誉为当(dāng)前人工智能(néng)发展的(de)智能底座(zuò)，是全球竞争最激(jī)烈(liè)的研究方向之一，包括谷歌、亚(yà)马逊、百(bǎi)度、阿里、腾(téng)讯(xùn)等众(zhòng)多头部企业(yè)都在(zài)竞相发(fā)力(lì)。

不过训(xùn)练大模型的(de)确价格不菲，以国盛证券发布的《ChatGPT需要多少算力(lì)》报告估算，GPT-3训练一(yī)次的成本约为140万(wàn)美元。而对于一些更大的LLM(大型语(yǔ)言模(mó)型)，训练成本则介于200万美元至1200万美元高价之间。

以ChatGPT在2023年(nián)1月(yuè)的独立访客平(píng)均数1300万(wàn)计算(suàn)，其对应芯(xīn)片需(xū)求为3万多片英伟(wěi)达A100 GPU，初始投入(rù)成本约为8亿美元(yuán)，每日仅电费就在5万美元左右。

此外不论是(shì)ChatGPT还是AIGC，都(dōu)离不开庞大(dà)算力支持。在关(guān)注各类大模(mó)型的发(fā)展同时，更(gèng)应该关注(zhù)算力网络(luò)的建设。

算力网(wǎng)络正驱动AI产业(yè)发(fā)展进(jìn)入史诗级加速进程，让AIGC及(jí)通用(yòng)AI这一人工(gōng)智(zhì)能发展的(de)终极目(mù)标离得更近。

因为(wèi)算(suàn)力可以对突破性(xìng)技(jì)术(shù)创(chuàng)新提(tí)供(gōng)大力的支持(chí)。这方面，多(duō)模态大模型是典型(xíng)。作为(wèi)面向(xiàng)未来强人(rén)工智能、通用人工智(zhì)能的重要技(jì)术创(chuàng)新，多模态(tài)大模型已经在人工智能领域提(tí)出了很(hěn)多年，业界也(yě)有不少技术(shù)突破(pò)，但是，多模态大(dà)模(mó)型进一步往下走，算力需求呈几(jǐ)何式(shì)上升，一(yī)般的(de)算力基础设(shè)施很(hěn)快将难以胜任。

从(cóng)图像、文字、语音单独(dú)一(yī)项的训练，到双(shuāng)模态、三模态的跃(yuè)迁，让人工智能可以灵活应(yīng)对不同模态的转化、像人与(yǔ)世界交互一样(yàng)自然(rán)，这方面，由算力网络来(lái)驱动将有明显优(yōu)势。