绿茶通用站群绿茶通用站群

天可汗是什么意思指的是谁,天可汗正确读音

天可汗是什么意思指的是谁,天可汗正确读音 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器人ChatGPT火爆以来,微软(ruǎn)公司(sī)创始(shǐ)人比尔(ěr)·盖(gài)茨已(yǐ)多(duō)次公开谈论人(rén)工智能话(huà)题。在最近的一次采访中(zhōng),他再次表示:“AI可能会让科技行业迎来一次剧烈的(de)洗牌”。

这个结(jié)论是他在当地时(shí)间(jiān)2月20日接受《In Good Company》节目专访时提出的(de)。

他预期,AI的发展可(kě)能(néng)会(huì)威胁到谷(gǔ)歌的市占(zhàn)率,因为微软在AI方面的行动(dòng)相当(dāng)迅(xùn)速。而最终(zhōng)科技巨头(tóu)将把AI整(zhěng)合成用户的(de)“全(quán)能助(zhù)手”,包揽一切应用,与(yǔ)人们(men)进行沟通并提(tí)供建(jiàn)议,可以取(qǔ)代亚马逊、Siri或Outlook等应(yīng)用。

大佬(lǎo)口中(zhōng)全(quán)能助手的到来(lái)可能尚需时日,但(dàn)由ControlNet引发的又一次(cì)AI绘(huì)画浪潮,让AIGC在(zài)ChatGPT的(de)话题热点包围(wéi)中杀出重围。

ChatGPT之后又一(yī)应(yīng)用杀疯了(le),AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能量(liàng)

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可控靠近

以AI绘画(huà)为(wèi)代表的AIGC上一(yī)次(cì)爆火的(de)时候(hòu),还(hái)是2022年8月,在美国科罗拉多州举办的(de)新(xīn)兴(xīng)数(shù)字(zì)艺术家竞赛中(zhōng),一幅名为《太空歌剧院》的作品获奖。

随后各大(dà)厂商的AI绘画软件被广(guǎng)大(dà)网友熟知并体验,Stable Diffusion便(biàn)是其中代表。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或(huò)进入可控期,将洗牌科技(jì)行业?_黑料正能(néng)量

用户们可(kě)以在应用中输入一组关键词或者(zhě)一张照片(piàn),就能获(huò)得(dé)一幅AI创作的画作。

作(zuò)画的关键就是所输入的(de)文本。同(tóng)一(yī)组关键词也(yě)可(kě)以创作出很多(duō)张风格不一样(yàng)的(de)画作(zuò),这让创作(zuò)的(de)过程就像开盲(máng)盒。

很多用(yòng)户很喜欢这种不确定的惊喜,他们会将生成的(de)美图当(dāng)做头像(xiàng)。而(ér)另一部(bù)分喜(xǐ)欢翻看AI绘画的“翻车”作(zuò)品。在社交媒体上,许多(duō)用户分享(xiǎng)AI“翻车现场(chǎng)”,例如,一位网友的小狗照片被AI画成了“肌肉男”,还有网友(yǒu)的个(gè)人照片被AI识别成了建筑(zhù)。

而如今随着ControlNet的出现与加(jiā)持(chí),以(yǐ)往AI绘画的(de)填(tián)写(xiě)关键(jiàn)词游戏可能要被颠(diān)覆了(le)。

ChatGPT之后又(yòu)一应(yīng)用杀疯了(le),AIGC或进(jìn)入可控期,将洗牌科技(jì)行业?_黑料(liào)正(zhèng)能量

ControlNet是一位正在斯坦福读博的中国人(rén)张吕敏创作(zuò)的一种基于(yú)控制点的图(tú)像变(biàn)形算法,主要(yào)用(yòng)于(yú)数字图像处理、计算机视觉(jué)和计算机图形学(xué)等领域(yù)。

其(qí)SD插件一(yī)经发布,在短(duǎn)短的两天内便成为了AI绘画领域最新的热(rè)点。

在此之(zhī)前,大家用了很(hěn)多方法想(xiǎng)让AI生成的结果(guǒ)尽可能的(de)符合(hé)要求,但是(shì)都不尽(jǐn)如人(rén)意,它的出(chū)现代表着AI生成开始进入真正的可控时期。

因为(wèi)ControlNet可以直接提取画面(miàn)的(de)构(gòu)图,人(rén)物的姿势和画面的深度信息等。有了(le)它的帮(bāng)助,就不用(yòng)频繁的用提示词来碰(pèng)运气,抽盲盒式的创作了(le)。

通(tōng)俗的说ControlNet相当于给AI绘画加(jiā)了“魔法”,不(bù)少博(bó)主的作(zuò)品已(yǐ)经获得了大量的浏览量,“viggo”就是其中(zhōng)之一,他用朋(péng)友的照片直接(jiē)带她们走(zǒu)进动漫世界。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将洗牌(pái)科(kē)技(jì)行业?_黑料(liào)正(zhèng)能量(liàng)

viggo先用StableDiffusion图片转文(wén)字(zì)。

再用Text2Prompt插(chā)件(jiàn)拓展(zhǎn)找到(dào)对(duì)应的关键(jiàn)词(cí);最后用ControlNet插件绑定骨(gǔ)骼开始换关键词试效(xiào)果。

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑(hēi)料(liào)正能量(liàng)

通过图片就可以看出来,效果十分惊(jīng)艳。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进(jìn)入可(kě)控期,将洗牌科(kē)技(jì)行业?_黑料正能(néng)量

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控(kòng)期(qī),将洗牌(pái)科技(jì)行业?_黑料正能量

更厉害的是,除(chú)了真实的照(zhào)片,草图也可以加(jiā)上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿转(zhuǎn)全彩图。大神(shén)张吕敏其本尊也亲自(zì)回应(yīng)。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科(kē)技行(xíng)业?_黑料(liào)正能量(liàng)

不得不(bù)说当下AIGC已(yǐ)经变得越来(lái)越(yuè)强(qiáng)大,甚至输出(chū)的作品都已经能以(yǐ)假乱(luàn)真了。

02

难辨虚实,AIGC技术力爆(bào)发

警(jǐng)惕(tì)安(ān)全问(wèn)题

近日,“苏州金(jīn)鸡湖有游艇party”的消息(xī)火遍网络,而经过警方辟谣这所谓的“party”可能是全国第一起(qǐ)AI绘图诈(zhà)骗。

由于这个(gè)活动里面给出的美女照片都是(shì)AI制作的真人照片绘图,因为太逼真,被大家当成(chéng)真事传播了

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量

不过(guò)仔细(xì)观察可以发现(xiàn),活动发(fā)起者提供的照片中有个(gè)很大的(de)漏洞可以(yǐ)发现并非真人,而是(shì)AI绘图,那便(biàn)是(shì)图片中女性的手(shǒu)指部分有的存(cún)在异常。

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进入可控期(qī),将洗牌科技(jì)行业?_黑料正能(néng)量

有行业(yè)人(rén)事表示:“现在因为(wèi)手指部(bù)分(fēn)的绘画(huà)算法比较复杂,AI还(hái)不太会画人的手,但(dàn)最新看到的(de)图(tú)片已经有越来越完美的AI模型出现,以后可能就完(wán)全没有漏洞(dòng)了。

类似的(de)AI作图诈(zhà)骗(piàn)在(zài)国外也已有发生。据英国广播公司报道,土耳其地(dì)震(zhèn)期间,有(yǒu)Tiktok用户使用(yòng)AI合成了(le)儿童受灾的假照片(piàn)发布到网(wǎng)络,以此诱骗善良的人打赏“捐助”从(cóng)而实施诈骗(piàn)。

目前随着技术发展,AIGC已经能做出真人照片般的(de)绘(huì)图效果(guǒ),如果(guǒ)这样的(de)图片被用来诈骗,将非常可怕。

此(cǐ)外(wài)AIGC还引发了很(hěn)多担忧,一方面,批判者认为AI在(zài)“学习(xí)”了大量(liàng)前人的作品之后,其创作没(méi)有任(rèn)何情(qíng)绪和灵(líng)魂(hún),难以和人(rén)类的艺术创作(zuò)相(xiāng)提并(bìng)论(lùn)。

另一方面,AIGC背后的版权、目前都(dōu)并没有得(dé)到(dào)有效(xiào)的解(jiě)决,还(hái)有(yǒu)AIGC会(huì)不会(huì)代替人类“至高无上(shàng)”的创意。

马斯克也强调,人(rén)工智能(néng)的安全问(wèn)题(tí)需要得到重视,太晚就(jiù)来不及(jí)了。

03

AIGC下一站(zhàn)除(chú)了视频,还有远方

技术都是有两面性的,潜(qián)在的危害并不能掩盖(gài)其光辉的贡献(xiàn)。现在看(kàn)来(lái),人工(gōng)智能技术将是第四(sì)次工业革命的核心驱(qū)动力(lì)量(liàng),将(jiāng)创造(zào)新的(de)增(zēng)长奇迹。

过去一年,人工智能在技(jì)术和商(shāng)业层面都有了巨大进(jìn)展,AI绘画就(jiù)是(shì)人工智能技术(shù)发生方向性改变的一个代表。其下一站(zhàn)或(huò)许就是视频。

此前,Meta和谷歌(gē)先后发布(bù)了(le)几条引爆科技圈(quān)的短视(shì)频。这些视频引(yǐn)发关注(zhù)并非内容做得多(duō)优(yōu)秀(xiù),反而都非常(cháng)简(jiǎn)单,比如一匹正在喝水的马,一只画画的(de)玩具(jù)熊,或(huò)者一段骑摩托(tuō)车的第一视角录像,随便一个有手机的人都可(kě)以随手(shǒu)录下一段。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或(huò)进入可控期,将洗牌(pái)科技(jì)行业?_黑料正能(néng)量(liàng)

但这些短视(shì)频的创(chuàng)作方(fāng)式非常简单(dān),创(chuàng)作者仅仅(jǐn)需(xū)要(yào)向AI输入一段话,甚(shèn)至只是说一下要求,AI就可以(yǐ)根据需要生成(chéng)一段视频。

谷歌发布(bù)的两个AI生成视频分别来(lái)自于Imagen Video和Phenaki,前者主要突(tū)出的是(shì)高清,与Meta的Make-A-Video没有太多的差别。

在Make-A-Video公布了AI生成的视频后,AI圈就已经玩(wán)了(le)一波(bō)梗,一个能够做出(chū)更高清视频(pín)的AI还不足(zú)以(yǐ)在(zài)短时间内戳中兴奋点。

Phenaki更(gèng)加令(lìng)人震惊的地方在于,它可以制(zhì)作(zuò)出超过2分(fēn)钟(zhōng)的连贯的也(yě)有确切内容的视(shì)频,这才是真正让(ràng)人们感(gǎn)到惊喜的地方。因为(wèi)无论AI生(shēng)成的(de)视频多么高清(qīng),也只能是为(wèi)内容生产(chǎn)者提(tí)供(gōng)一(yī)个灵(líng)感(gǎn),一个素(sù)材,一个过场动画。

不过能够制作(zuò)出有具体剧情内容的视(shì)频(pín)就意味着,一些视频创(chuàng)作由(yóu)AI代替人工完成已经(jīng)初步有(yǒu)了(le)可能。

当下AI的发展速度已经超过(guò)大部分人的(de)想象(xiàng)。内容产业的本(běn)质(zhì)是供给创造需求,AIGC作为全新(xīn)的内容(róng)生产(chǎn)方式(shì),可以(yǐ)为(wèi)内容产业(yè)带来更(gèng)新的内容风(fēng)格、更(gèng)快的(de)生(shēng)产速(sù)度,更低的生产(chǎn)成(chéng)本,这无疑(yí)会驱(qū)动内容产业的大爆发。

除了AI绘图、视频,AIGC技(jì)术还(hái)能应用于(yú)音乐、代码、机器人动作等(děng)多种内容形式的生成(chéng)。不难(nán)发(fā)现该(gāi)项(xiàng)技术不仅在游戏(xì)等行业能得到(dào)有(yǒu)效应用(yòng),对(duì)于(yú)下一代互(hù)联(lián)网各种元(yuán)素的构建(jiàn)亦(yì)有关键意义。

从商业化的(de)角度来看,文化娱乐(lè)、教(jiào)育、传(chuán)媒等诸多(duō)领域,本身就对基(jī)于AI的(de)可视化内容有强烈需求。

因(yīn)此,AI绘画(huà)及视(shì)频或不(bù)是(shì)结果,而只是AI进(jìn)程中的一块重(zhòng)要(yào)拼图,有望在(zài)技术更(gèng)新的加持下实(shí)现更(gèng)大的应用价值。

AI从理解内容,走向了可以生成内(nèi)容(róng),甚至能够创造出独(dú)立价值和独立视角的内(nèi)容。AIGC的(de)再次出圈,更代表(biǎo)着未(wèi)来的先进生产力即将(jiāng)到来。

ChatGPT之后(hòu)又(yòu)一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行(xíng)业?_黑料正能量(liàng)

天可汗是什么意思指的是谁,天可汗正确读音g>04

紧抓(zhuā)大模型与(yǔ)算力,牢固AIGC底座

从技(jì)术(shù)的发展也可以看出,在(zài)语言大(dà)模(mó)型、图像大模型之后,多模态(tài)大模型已经成为了新(xīn)的趋势。

大模型被誉为当前人(rén)工智能发展的智(zhì)能底座,是全球竞(jìng)争最激烈的研究方向之(zhī)一,包括谷(gǔ)歌、亚马逊、百(bǎi)度、阿里、腾讯等众多头部企业都在竞相发力。

不过训练(liàn)大模型(xíng)的确价格不菲,以国盛证券发布的(de)《ChatGPT需要多少算力》报告估(gū)算,GPT-3训(xùn)练一次的成(chéng)本约为140万美元(yuán)。而对于一些(xiē)更(gèng)大的LLM(大(dà)型语(yǔ)言模型),训练成本则(zé)介于200万美元至1200万美元高价之(zhī)间(jiān)。

以ChatGPT在(zài)2023年1月的独立访(fǎng)客平均数(shù)1300万计算,其(qí)对应(yīng)芯(xīn)片需求为3万多片英伟(wěi)达A100 GPU,初始投入(rù)成本约为8亿美元,每(měi)日仅电费(fèi)就在5万美元左右。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控(kòng)期,将(jiāng)洗牌科技(jì)行(xíng)业(yè)?_黑料正能(néng)量

此外(wài)不论是ChatGPT还(hái)是AIGC,都离不(bù)开庞大算力支(zhī)持。在关注各(gè)类大模型的(de)发展同时(shí),更应(yīng)该关(guān)注算力网络的(de)建设。

算力网络正驱(qū)动(dòng)AI产(chǎn)业(yè)发展进入(rù)史诗级加速进程(chéng),让AIGC及通用(yòng)AI这一人工智能发(fā)展的终极目标离得(dé)更近。

因为算力可以对突破性技术(shù)创新提供(gōng)大力的(de)支持。这方面(miàn),多模态大模(mó)型是典(diǎn)型。作为(wèi)面向未(wèi)来(lái)强人(rén)工智能、通用人工智(zhì)能的重(zhòng)要技(jì)术创新,多(duō)模(mó)态大模型已经在人(rén)工智能(néng)领域提出了(le)很(hěn)多年,业界也有不少技术(shù)突(tū)破,但(dàn)是,多模态大模型进一步往(wǎng)下走,算力需(xū)求(qiú)呈几何(hé)式上升,一(yī)般的算力基础设施很(hěn)快(kuài)将难(nán)以胜任。

从(cóng)图像(xiàng)、文字、语音单独一(yī)项(xiàng)的训练,到(dào)双模态、三模态(tài)的跃(yuè)迁,让人工(gōng)智能可以灵活(huó)天可汗是什么意思指的是谁,天可汗正确读音应对不(bù)同模态的转化、像人(rén)与(yǔ)世界交(jiāo)互一样自然,这方面,由算(suàn)力网络来驱(qū)动将有明显(xiǎn)优势。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能量

此外,还有很多需要(yào)爆发式增(zēng)长的算力来支撑(chēng)的技术创新,将在(zài)人工(gōng)智能(néng)算力(lì)网络支撑下(xià)快速推(tuī)进。

AIGC已经露出(chū)曙(shǔ)光(guāng),期待在大模(mó)型和大算力的(de)支持下AIGC能(néng)持续颠覆内容生产的(de)方式(shì),将创(chuàng)造的边际成本降低,让万众(zhòng)受(shòu)益。

未经允许不得转载:绿茶通用站群 天可汗是什么意思指的是谁,天可汗正确读音

评论

5+2=