▲ boxi用midjourney绘制
AI 的世界大致可分为 3 个领域(当然了,这是一种过于简化的说法):
大型语言模型。这些属于通用模型,如 GPT-4 或 Chinchilla,LLM 会摄取 web(或其他文本/语言来源)的内容,然后转换成可以做任何事情(比如生成法律文件摘要,使用搜寻引擎,或作为友好的聊天机器人)的模型。
图像生成,包括 Midjourney、Dall -E 或 Stable Diffusion 等模型以及当前一些易用的影片制作工具以及 NeRF 等 3D 模型。这些模型可让使用者输入提示来产生图像。
其他(这一类包括的技术和市场范畴非常大,确实不应该硬凑在一起)。其中包括了机器人技术、自动驾驶汽车、蛋白质折叠等众多其他应用领域。我这里出于简化需要把它们统统归为一类显然是很愚蠢的做法。显然,AlphaFold 2 与自动驾驶汽车的模型架构和终端市场都不一样。不过,因为相对于一本书而言,这是一篇篇幅不长的文章,所以请多多包涵。就本文而言,我会暂时忽略放在其他框的内容。
当大家在谈起「生成式人工智慧」时,往往会将这些领域混为一谈。实际上,每个市场都有不同的底层 AI 模型架构、运算、扩展需求、品质标准以及应用领域。重要的是将它们分开以尝试推断它们可能带来的未来。
A. 图像生成与 LLM:在成本、品质、规模、细分领域方面都截然不同领域 |
图像生成 |
LLM |
做出尖端模型的成本 |
数十万至数百万美元 ,,bet365博彩(www.bet365gw.vip)是bet365博彩公司在线上直营的亚洲官网(365BET)。bet365博彩开放bet365最新网址、bet365中国大陆网址(bet365中国备用网址)、bet365中国app下载。bet365博彩是全球最大的博彩平台,bet365博彩是支持人民币的博彩公司,bet365博彩是博彩网推荐的体育博彩平台排名。 |
数千万至数亿美元,后续甚至达到十亿美元的量级 |
对输出的品质要求 |
可接受的「答案」的范围更广,对图像输出的品质要求很高 | 很多应用对精确度要求很高 |
近期应用领域 |
庞大 | 庞大+++ |
远期应用领域 |
庞大+(如果把影片纳入进来 的话) |
庞大++ |
防御性与护城河 |
可能可以透过合作关系、品牌、UI互动建立 |
可能可以透过规模、准确性、全面性确立 |
开源 |
开源、闭源混合,开源也许是建立在闭源的基础上 | 闭源可能会领先与开源,至少在短期内,因为模型保真度增加也要相应扩充运算,加大投入;如果下一代模型的训练需要数十亿美元的成本的话,开源就要落后与闭源,除非有大财团支持。
相关阅读 |
评论列表 (0条)