日前,美国开放人工智能研究中心OpenAI,发布了首个文生视频大模型Sora,再次在全球掀起了人工智能关注浪潮。AIGC(人工智能生成内容)指的是利用人工智能技术,通过已有数据寻找规律,自动生成各种类型的内容。在AIGC技术应用的模态中,有一种模态是文本生成,而ChatGPT就是其中的代表产品之一。
AIGC的发展历程。AIGC的发展起起伏伏,大概经历了以下三个阶段:2010—2015年是小模型阶段,小模型擅长分析任务,可以用于交货时间预测、欺诈分类等工作,但无法生成人类级别的协作;2015—2021年是规模竞赛阶段,Google Research的一篇里程碑式的论文描述了一种用于自然语言理解的新的神经网络架构,它可以生成高质量的语言模型,可以相对容易地针对特定领域进行定制;2022年之后是更好、更快和更便宜阶段,研究人员继续开发更好的算法和更大的模型,开发人员的访问权限从封闭测试扩展到开放测试。
AIGC的应用场景。目前,AIGC的应用集中在数字化程度高、内容需求丰富的娱乐、传媒、影视、电商等领域。如新闻稿撰写,很多新闻机构使用人工智能软件生成稿件,尤其是体育、天气、股市交易变动等结构性新闻报道;如自动语音生成,将文本转化为语音,广泛应用于新闻阅读、有声书、出行导航等领域……随着模型越来越聪明,并积累了使用者越来越多的数据,这些原型或初稿也将越来越完善。
AIGC的现有挑战。从算力需求来看,目前研究发现模型能力和模型规模呈明显的正相关关系,而模型规模扩大必将导致更高的算力成本。据海通证券估计,ChatGPT每年GPU需求空间约为7000万美元。从数据需求来看,AIGC模型的训练需要大量数据,且对数据质量有一定要求。以LLM为例,GPT-1训练数据为4GB,而ChatGPT达到45TB。
AIGC的未来展望。AIGC的发展势必带来生产关系的变化,在AIGC时代需要重新思考“人机关系”。目前AIGC的工作模式基本处于人指示AI的阶段,AIGC作为一个辅助工具,大部分工作仍然需要人完成。在未来,AI将独自完成更多工作,减少人的参与。
本报记者 龙敏飞 整理


