时间:2023-11-18 11:38

什么,还必须要关注“技术”设法什么。
昨天凌晨,整个AI界发生了一场地震,在被作为“首届AI春晚”的OpenA开发者大会上,GPT-4进行了史诗版本的更新。
128K的超长上下文、成本更低的tokens、全新的Assistants API、新增的多模态功能以及文本转语音(TTS)技术,都让新版的 GPT-4Turbo 模型变得性能更强大,同时也更具注入性。
图源备注:图片由AI生成,图片授权服务商Midjourney
然而,除了上述功能外,最令人惊艳的,莫过于GPT商店的问世。
CEO山姆·奥特曼现场登台演示,全程不到3分钟,无需任何编程操作,只需在沟通框内告诉GPT自己的需求,一个“创业导师GPT”就应运而生。
是的,所有想达成的功能,都能经过聊天构建!
不仅如此,OpenAI还发布,GPT商店将在这一月晚一点的时候推出。
这意味着,任何人都能靠制作专属GPT来赚钱了!
此言一出,网友即刻群起沸腾,并纷纷惊觉:AI的致富之路,真的对所有人敞开了!
那么,在这种百花齐放的应用生态中,AI时代的爆款应用,是否会就此诞生?而由此催生的应用生态,又将打造怎么壮伟的市场?
1
怎么建立壁垒?
自从互联网时代以来,几乎每一次技术的迭代,都会造就一批爆款。
而总结这些爆款的特征时,人们往往会闪现如下的联合点:
它们不仅有长期的留存率,能构建商业模式,且有一定的护城河。虽然当时很难估算集市规模,但将来或者就是千亿美金的公司,可遇无从求。
举例移动互联网时代的抖音,就是个典型的例子。
而眼前,GPT商店的推出,无疑为这类AI时代的“抖音”,提供了诞生的土壤。
然而,兴奋过后,冷静下来的人们也发现了个问题,那就是:在当前OpenAI打算构建的GPT商店 中,那一个个上架的应用,刚需点和壁垒究竟何在?
是的,无门槛的开发,意味着人人都能上,可既然人人都能上,那谁又会为别人制作的GPT而付费呢?
大家设法什么功能,本身做不就完了吗?
为了解开这一悖论,我们有必要对日前GPT商店所构建的这种UGC生态,与前AI时代的UGC生态进行一个对比。
假使说,要想在前AI时代,为GPT商店的这种UGC模式,找一个最接近的例子,那没准最先入选的,就是以Roblox、蛋仔派对为代表的各种游戏类UGC社区。
在Roblox中,用户允许使用平台供应的易用的编辑工具,创立游戏场景、角色和道具,并将这些游戏资产发表到平台上,供其他用户玩耍、购买。
在这样一种生态中,所有的玩家,都是基于同一个平台或工具进行创作,谁也不会比谁占有更多先天的、硬性的优势。
这样的特点,与GPTs经过互动成立专属GPT,从而抹平用户创作门槛的做法,几乎如出一辙。
而且由于“玩法”、“革新”之类的东西是抽象的,是仰赖于用户灵感,而非知识、技能的,因此在Roblox这类UGC社区中,所谓的“壁垒”从根本上说是没有的。
可既然没有壁垒,为何人们照样愿意为其他玩家/用户创作的内容付费?而不是自己创作?
其实原因很简单,因为在这类UGC生态中,用户创造的内容,是一种“易学难精”的东西。
换句话说,表面上看人人都允许创造,但精品的、又好又快的内容,却很难复制。
具体地说,在这类UGC社区中,用户/玩家虽然允许使用游戏内的编辑器,创造出各种道具、地图等虚拟物品,但真正受欢迎的、爆火的内容,往往需要付出很大的心血,或是需要天才的构思。
于是乎,最后懒得细细打磨的人,就会选购买别人创作好的、现成的游戏内容。
然而,虽然Roblox这样的UGC模式,给未来GPT商店上的创作者供给了一个启示,但它一样有回应不了的问题,那就是:
Roblox这类平台,终归是个以娱乐为主的游戏平台,而游戏是不讲究“实用性”的,只要做得有趣,即可让人掏钱。
但在GPT商店这种明显带有工具性、实用性的平台上,各类基于GPT的应用,该怎么找到自己的“刚需”点呢?
2
“刚需”的误区
很多人在讨论大模型(LLM)与“刚需”问题时,往往会陷入一个误区:那就是以此刻的、静止的视角,来看待人们对LLM的需求。
实际上,假设用“刚需”的逻辑来看待当初的抖音、快手,那它们根本就不怎么存在。
源于以当时的标准来看,它们根本就不“刚需”。
其实,所谓的需求,不是一成不变的,今天很多理所当然的“刚需”,也不是当时就产生的。
它本质上是一个随着技术逻辑运动,而不断发展的结果。
具体来说,抖音、小红书这样非工具性、非刚需的APP之所以会涌现并爆火,本质上是移动互联网技术逻辑的一种运动结果。
在移动互联网的技术逻辑中,最重大的有两点,一是便捷性,二是个性化。
便携性,使得用户可以随时随地访问互联网,获取信息。
这种情况下,用户的时间变得更加碎片化了。在等待、通勤、休息等场景下,用户期许利用碎片时间进行娱乐、学习或购物等活动。
于是,人们使用手机等移动设备的需求,开始变得越来越多样了。那么,面对如此多样的内容,用户该如何选择?
这时,推荐算法和大数据登场了。
移动互联网的普及,使得用户在移动设备上产生了大批的数据,这些数据为推荐算法和大数据分析供应了充裕的数据来源。
通过对这些数据的分析,各大APP可以更好地了解用户的兴趣和需求,从而供给个性化的内容和推荐。
于是乎,在便携性和个性化两大技术逻辑的推动下,抖音、小红书这些爆款APP就诞生了。
它们可以说是移动互联网技术逻辑的一种终极体现,确定结果。
由此可见,在分析某种刚刚起步技术是否能满足“刚需”时,我们除了关注“人”想要什么,还必须要关注“技术”设法什么。
那么,按照这样的逻辑,今日以ChatGPT为首的LLM,究竟想要什么呢?
从最近大半年LLM的发展趋势,以及昨日OpenAI宣布会的情况来看,目下的LLM,至少浮现出了两大越来越明显的倾向:
一是想“看”到和“听”到更多,即多模态方向的发展;
二是想与更多的“同伴”合作,即智能体(Agent)方向的发展。
而这两大愈发明显的倾向,就构成了未来LLM发展的两大技术逻辑——消息混入和自主决策。
资讯融合,意味着LLM允许通过融入多种模态的采访(如视觉、听觉等),兑现对跨模态、跨领域任务的深入理解,从而更好地胜任不同场景的需求。
而自主决策,则经过多个智能体之间自动化的互助、联合,使LLM能实当今复杂环境、任务中的自主决策和行动,从而大大地解放了人类的时间、心智。
正如移动互联网的诞生,催生了碎片化时间的场景同样,上述两大逻辑的演化和推进,也终将催生出一些人们从来没见过的,新的场景与需求。
3
可能的应用形态
在自主决策和报道结合催生的新场景与需求中,最能代表其本质的,就最有或然产生新时代的“抖音”。
从上述技术逻辑的特点来看,至少有两个方向的需求,或然性是最高的。
一是个性化的智能助理。
由于多模态技术的存在,这样的智能助理,将很有或者脱离单一领域,或单一模态的限制,从而最大限度地深入人们的生活。
例如来说,如若某人使用了某个翻译类的GPT,那么该用户能够在翻译之外,还祈盼该应用兼具机票预订的功能,帮跨境出行做好准备,又或是在此基础上,成为一个智能的跨境电商的助手,对比不同国家、地区的商品。
第二个方向的需求,则是智能决策支持
要么一种技术,用与不用有很大区别时,它就会一步步成为一种“刚需”。而智能决策,能够日前创造这样的需求。
自动化的智能体系统,最大的意义,不在于让打工人平时节省那么几个小时的时间,干些批量处理文档之类的“牛马活”,而在于其通过快速、高效和多角度的分析,为用户提供“单一大脑”所难以得出的洞见。
例如,最近一家名为Fantsy的企业,就用了类似于ChatGPT和Bard的机器学习技术,创立了一些具有详细背景和思想、性格的智能体,让它们在虚拟的小组中进行讨论,从而对尚未发布的产品进行评估。
一样的,类似的技术思路,也允许用于个人的财务规划、职业规划中,从而为个人在现实中的生活、工作,供应又好又快的辅助决策。
综上所述,GPT商店的涌现,虽然为各类AI应用的繁茂生长提供了土壤,但所谓“爆款应用”,却并非完全靠人为的、主观的“穷思竭虑”就能想出来的。
所谓爆款的诞生,本质上继续要遵从技术发展的平常规律,唯有参透了这样的规律,并在此基础上切磋、构建产品,才能长久地在智能时代扎下根脉。
(举报)
AI正版系统源码推荐:小狐狸GPT-AI付费创作系统+对接中国各大接口