绿茶通用站群绿茶通用站群

事出有因必有妖下一句怎么回,事出反常必有妖,人若反常必有刀,言不由衷定有鬼

事出有因必有妖下一句怎么回,事出反常必有妖,人若反常必有刀,言不由衷定有鬼 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人(rén)ChatGPT火爆以来,微软公司创始(shǐ)人(rén)比尔·盖茨已多次公开(kāi)谈论人工智(zhì)能话题。在(zài)最近的一次采访中,他再次表示:“AI可能会(huì)让科技行(xíng)业迎(yíng)来一次剧烈的(de)洗(xǐ)牌”。

这个(gè)结(jié)论是他在当地时间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预期,AI的发展可(kě)能(néng)会威胁到(dào)谷(gǔ)歌的市占率,因为微软(ruǎn)在AI方面的行动相当(dāng)迅(xùn)速(sù)。而(ér)最终科技巨头(tóu)将把(bǎ)AI整合成用户的“全能(néng)助手”,包揽(lǎn)一切(qiè)应用,与(yǔ)人们进行沟通(tōng)并提(tí)供建议,可(kě)以(yǐ)取(qǔ)代亚马(mǎ)逊(xùn)、Siri或(huò)Outlook等应用。

大佬口中全能助手的到来可能(néng)尚(shàng)需时日(rì),但(dàn)由(yóu)ControlNet引(yǐn)发的又一次AI绘画浪潮,让(ràng)AIGC在(zài)ChatGPT的话题热点包围中杀出(chū)重围。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科(kē)技行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的时候,还是(shì)2022年8月,在美(měi)国科(kē)罗拉多州举(jǔ)办(bàn)的新兴数字艺(yì)术家(jiā)竞(jìng)赛中,一幅名为《太(tài)空歌剧院》的(de)作品获奖(jiǎng)。

随后各大厂商的(de)AI绘画软件被(bèi)广(guǎng)大网友熟知并体验(yàn),Stable Diffusion便是(shì)其(qí)中代(dài)表。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控(kòng)期,将(jiāng)洗牌(pái)科技行业?_黑料正能量

用户们可以在应用(yòng)中输入一组关(guān)键(jiàn)词或者一张照片(piàn),就能获得一幅AI创作的画(huà)作。

作(zuò)画(huà)的(de)关键就是(shì)所输入的文本(běn)。同一(yī)组关键词也可以创作(zuò)出(chū)很多张风格(gé)不一样的(de)画作,这让(ràng)创作的过(guò)程就(jiù)像开(kāi)盲盒。

很多用户很(hěn)喜欢这种不确定(dìng)的惊喜,他们(men)会将生成(chéng)的美图当做头像。而另(lìng)一部分喜(xǐ)欢(huān)翻看AI绘(huì)画的(de)“翻(fān)车”作品。在社交媒体上,许多用户分(fēn)享AI“翻车现(xiàn)场”,例(lì)如,一(yī)位网友的(de)小(xiǎo)狗照片被AI画成了“肌肉男”,还(hái)有网友的(de)个人照片被AI识别成(chéng)了建筑。

而如今(jīn)随着ControlNet的出现与加持,以往AI绘画的(de)填写关(guān)键词游戏可能(néng)要(yào)被颠(diān)覆了。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进入(rù)可控期,将洗牌科技行(xíng)业?_黑料正能量

ControlNet是一(yī)位正在斯坦(tǎn)福读博的(de)中国人张吕敏创作的一种基(jī)于(yú)控制点的图像变形算法,主要用(yòng)于数字图像处理、计算机视觉和计算(suàn)机图形学(xué)等领域。

其SD插件一经发布,在短短的两(liǎng)天内便成为了(le)AI绘(huì)画(huà)领域(yù)最新的热点。

在此之(zhī)前,大家用了很多方法想让AI生成(chéng)的结(jié)果尽可能的符合(hé)要求(qiú),但是都不尽如(rú)人意,它的出(chū)现代表着AI生成开始进入(rù)真正的可控时期。

因(yīn)为ControlNet可以直(zhí)接提取画面(miàn)的构图(tú),人物的姿势和画面的(de)深度信息等。有(yǒu)了它的帮助,就(jiù)不用频繁的用提示(shì)词来碰运(yùn)气,抽盲盒(hé)式的创作了(le)。

通俗(sú)的(de)说ControlNet相当(dāng)于给AI绘(huì)画加(jiā)了“魔法(fǎ)”,不(bù)少博(bó)主的(de)作品(pǐn)已经(jīng)获得了大量的(de)浏览量,“viggo”就是其(qí)中之一,他用(yòng)朋友的(de)照片(piàn)直接带(dài)她们走进动漫世界。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入(rù)可控(kòng)期,将洗牌(pái)科技行业?_黑(hēi)料正能(néng)量(liàng)

viggo先用StableDiffusion图(tú)片转文字。

再用Text2Prompt插件(jiàn)拓展找(zhǎo)到对应(yīng)的关键词;最后用ControlNet插件绑(bǎng)定骨骼开始换(huàn)关键词试效果。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入(rù)可(kě)控期,将洗(xǐ)牌科技行业?_黑料正能量(liàng)

通过图片就可以看出来,效果十分惊(jīng)艳。

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌(pái)科(kē)技(jì)行(xíng)业?_黑料正能量

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技(jì)行业?_黑(hēi)料正能量

更厉(lì)害的是,除了真实的照片,草图也可以(yǐ)加(jiā)上“魔法(fǎ)”,知乎大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实现线(xiàn)稿转全彩图。大神张吕敏其本尊也亲自回(huí)应。

ChatGPT之后(hòu)又(yòu)一应用杀疯了(le),AIGC或进入可控期(qī),将洗牌科技(jì)行业?_黑料正能量

不得(dé)不说当下AIGC已经变得越来越(yuè)强大(dà),甚至(zhì)输出的作品都(dōu)已经能以假乱真了(le)。

02

难辨虚实(shí),AIGC技术力爆发

警惕(tì)安全问题(tí)

近日(rì),“苏州金鸡湖有游(yóu)艇party”的消息火遍网络,而经(jīng)过警方辟(pì)谣这所谓的“party”可能是全国(guó)第(dì)一起(qǐ)AI绘图诈骗。

由(yóu)于(yú)这个活动里(lǐ)面给出的美女照片都是AI制作的(de)真人照片绘图(tú),因为太逼真,被大家当成真(zhēn)事传播了(le)

ChatGPT之(zhī)后又(yòu)一应用杀(shā)疯了(le),AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能量

不过(guò)仔细观察可以发(fā)现,活动(dòng)发起者提供的照片(piàn)中有个很大的漏洞可以发现并(bìng)非真人,而(ér)是(shì)AI绘图,那(nà)便是图(tú)片(piàn)中(zhōng)女性的(de)手指部分有的存(cún)在异常。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科(kē)技行业?_黑(hēi)料正(zhèng)能量

有行业人事表示:“现在因为(wèi)手指部(bù)分(fēn)的绘画算法比较复杂,AI还不太(tài)会(huì)画(huà)人的(de)手,但最(zuì)新看(kàn)到的图(tú)片已经(jīng)有越来越完美(měi)的AI模型出现,以后可能(néng)就完全没(méi)有漏洞了。

类(lèi)似(shì)的(de)AI作图诈骗(piàn)在国外(wài)也已有发生。据(jù)英国广播公司(sī)报道,土耳(ěr)其地震期间,有Tiktok用户(hù)使用AI合成了(le)儿童受灾的假(jiǎ)照片发布到网络,以(yǐ)此诱骗善良的(de)人(rén)打(dǎ)赏(shǎng)“捐助”从而实施(shī)诈骗。

目前随(suí)着技术发展,AIGC已经能做出真(zhēn)人照片般的绘图效果(guǒ),如(rú)果这样的图(tú)片被(bèi)用(yòng)来诈骗,将非常可怕(pà)。

此外AIGC还引发了很(hěn)多担忧(yōu),一方面,批判者认为AI在“学习”了(le)大量前人的(de)作品(pǐn)之后,其创作(zuò)没(méi)有(yǒu)任(rèn)何情绪和灵魂(hún),难以(yǐ)和(hé)人类的艺(yì)术(shù)创作相提并论。

另一(yī)方面,AIGC背后(hòu)的(de)版(bǎn)权、目前都(dōu)并没有得到有(yǒu)效的解(jiě)决,还有AIGC会不会(huì)代(dài)替(tì)人类“至高无上”的创意。

马斯克也强调,人(rén)工智(zhì)能的安(ān)全问题需要(yào)得(dé)到重视(shì),太(tài)晚(wǎn)就(jiù)来不(bù)及了。

03

AIGC下一站(zhàn)除了视(shì)频,还有远方

技术都是有两面性的,潜在的危害(hài)并(bìng)不能掩盖其光辉的贡献。现在看来,人工智(zhì)能技术将(jiāng)是第四次工业革(gé)命的(de)核心驱动力量,将创造新的增长奇迹。

过(guò)去一年(nián),人工智(zhì)能在技术和商业层面都有了(le)巨大进展,AI绘(huì)画就是人(rén)工(gōng)智能技(jì)术发生方向(xiàng)性改变的(de)一个代表。其下一站(zhàn)或许(xǔ)就(jiù)是(shì)视频。

此前,Meta和(hé)谷(gǔ)歌先后发布(bù)了几(jǐ)条引(yǐn)爆科技圈的短视频。这些视频引发关(guān)注并非内(nèi)容做得多优(yōu)秀,反(fǎn)而都非(fēi)常简单(dān),比(bǐ)如一匹正在喝水的马,一(yī)只画画的玩(wán)具(jù)熊,或者一段骑摩托(tuō)车的第一视角(jiǎo)录像,随便一个有手(shǒu)机(jī)的(de)人都可以随(suí)手(shǒu)录下一段(duàn)。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行(xíng)业(yè)?_黑(hēi)料正能(néng)量

但这些(xiē)短(duǎn)视频的(de)创作(zuò)方式非常简单,创作者仅仅需(xū)要向AI输入(rù)一(yī)段话,甚至只是说一(yī)下要求(qiú),AI就可以根据(jù)需要生成(chéng)一段视频(pín)。

谷歌发布(bù)的(de)两个(gè)AI生成视频分别来自(zì)于Imagen Video和(hé)Phenaki,前者主要突出的是高清(qīng),与(yǔ)Meta的Make-A-Video没有太多的差别。

在(zài)Make-A-Video公布了AI生成的视频后,AI圈就(jiù)已经(jīng)玩(wán)了(le)一波梗,一(yī)个能够做出更(gèng)高清视频的AI还不足以在短时间内戳中兴奋(fèn)点(diǎn)。

Phenaki更加(jiā)令人震(zhèn)惊的(de)地方在于(yú),它(tā)可(kě)以制(zhì)作出(chū)超过(guò)2分钟的连贯(guàn)的也有确切内容(róng)的视频,这才(cái)是(shì)真正让人们(men)感到惊喜的地方。因为无论(lùn)AI生成(chéng)的视频多(duō)么高清,也(yě)只能是为内容(róng)生产者(zhě)提供(gōng)一个灵(líng)感,一个素材,一(yī)个过场动(dòng)画。

不过(guò)能够制作出(chū)有具体剧(jù)情内(nèi)容(róng)的视频就意味(wèi)着(zhe),一些(xiē)视频创作由AI代替人工完成(chéng)已经初步有了可能。

当下(xià)AI的(de)发展速度已经(jīng)超过(guò)大部分人的想象。内容产业的(de)本(běn)质(zhì)是供给(gěi)创造需求,AIGC作为(wèi)全新的内容生产方式(shì),可以为内(nèi)容产业带来更新的内容(róng)风(fēng)格、更快的生产速度,更(gèng)低的(de)生产成本,这无疑会驱动内容产业的大爆发。

除了AI绘图(tú)、视频,AIGC技术还能应(yīng)用于音乐、代(dài)码(mǎ)、机(jī)器人动作等(děng)多种内容形式的(de)生(shēng)成。不难发现该项技(jì)术不仅在游戏等行业能(néng)得(dé)到有效应用,对于下一代互联网各种元素的构建亦有关键意义(yì)。

从商业化的角度来看,文化(huà)娱乐、教育、传媒等诸多(duō)领域,本身就对基于AI的可视化(huà)内容有强烈需求。

因此(cǐ),AI绘画及(jí)视频或(huò)不是结果,而(ér)只是AI进程中的一块重要拼图,有望(wàng)在技术更新的加持下实现更(gèng)大的应用价值。

AI从理解内容,走向了可以生成内容,甚至(zhì)能够创造(zào)出(chū)独立价值(zhí)和独立视角(jiǎo)的内容。AIGC的(de)再次(cì)出(chū)圈,更代表着未来(lái)的先进生(shēng)产力(lì)即(jí)将到来(lái)。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技(jì)行业?_黑料正能(néng)量

04

紧抓大(dà)模型与(yǔ)算(suàn)力,牢固AIGC底(dǐ)座

从技(jì)术(shù)的(de)发展也可以看出,在语言大(dà)模(mó)型、图(tú)像大模型之后(hòu),多模(mó)态大模型(xíng)已经成为了新的趋势。

大(dà)模型被誉为当(dāng)前人工智能(néng)发展的(de)智能底座(zuò),是全球竞争最激(jī)烈(liè)的研究方向之一,包括谷歌、亚(yà)马逊、百(bǎi)度、阿里、腾(téng)讯(xùn)等众(zhòng)多头部企业(yè)都在(zài)竞相发(fā)力(lì)。

不过训(xùn)练大模型的(de)确价格不菲,以国盛证券发布的《ChatGPT需要多少算力(lì)》报告估算,GPT-3训练一(yī)次的成本约为140万(wàn)美元。而对于一些更大的LLM(大型语(yǔ)言模(mó)型),训练成本则介于200万美元至1200万美元高价之间。

以ChatGPT在2023年(nián)1月(yuè)的独立访客平(píng)均数1300万(wàn)计算(suàn),其对应芯(xīn)片需(xū)求为3万多片英伟(wěi)达A100 GPU,初始投入(rù)成本约为8亿美元(yuán),每日仅电费就在5万美元左右。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑(hēi)料正能量

此外不论是(shì)ChatGPT还是AIGC,都(dōu)离不开庞大(dà)算力支持。在关(guān)注各类大模(mó)型的发(fā)展同时,更(gèng)应该关注(zhù)算力网络(luò)的建设。

算力网(wǎng)络正驱动AI产业(yè)发(fā)展进(jìn)入史诗级加速进程,让AIGC及(jí)通用(yòng)AI这一人工(gōng)智(zhì)能发展的(de)终极目(mù)标离得更近。

因为(wèi)算(suàn)力可以对突破性(xìng)技(jì)术(shù)创(chuàng)新提(tí)供(gōng)大力的支持(chí)。这方面,多(duō)模态大模型是典型(xíng)。作为(wèi)面向(xiàng)未来强人(rén)工智能、通用人工智(zhì)能的重要技(jì)术创(chuàng)新,多模态(tài)大模型已经在人工智能领域提(tí)出了很(hěn)多年,业界也(yě)有不少技术(shù)突破(pò),但是,多模态大(dà)模(mó)型进一步往下走,算力需求呈几(jǐ)何式(shì)上升,一(yī)般的(de)算力基础设(shè)施很(hěn)快将难以胜任。

从(cóng)图像、文字、语音单独(dú)一(yī)项的训练,到双(shuāng)模态、三模态的跃(yuè)迁,让人工智能可以灵活应(yīng)对不同模态的转化、像人与(yǔ)世界交互一样(yàng)自然(rán),这方面,由算力网络来(lái)驱动将有明显优(yōu)势。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或进入可(kě)控期,将洗(xǐ)牌科技行业?_黑料(liào)正能量

此外,还有很多需(xū)要爆发式增长的算力(lì)来支撑的技术创(chuàng)新,将在人(rén)工(gōng)智能算力网络支撑(chēng)下快速推进。

AIGC已经露(lù)出曙(shǔ)光,期待在大(dà)模型和大(dà)算力的支持下AIGC能(néng)持续颠覆内(nèi)容(róng)生产的方式,将(jiāng)创造的(de)边际成本降低,让万众受益。

未经允许不得转载:绿茶通用站群 事出有因必有妖下一句怎么回,事出反常必有妖,人若反常必有刀,言不由衷定有鬼

评论

5+2=