移动版

AI王者 MegaByte 刷新纪录,实现超强伪原创能力!

2023-06-07 09:16 爆米花 0
编辑有话说:Meta的新模型MegaByte是一个令人振奋的进展!它能够增强AI的生成能力,产生更出色、更洞察力的内容。这将为各行各业提供了更大的创新空间,极大地推动了人工智能的发展。期待看到MegaByte带来的积极变化!

来自Facebook母公司Meta的人工智能研究人员提出了一种新颖的方法MegaByte,以加快自然语言处理等用途的内容生成。据介绍,来自Facebook母公司Meta的人工智能研究人员提出了一种新颖的方法MegaByte旨在改进更长的内容生成。像OpenAI的ChatGPT这样的系统可以轻松处理短输出,但序列越长或越复杂,模型的性能就越差。

Meta提出新模型MegaByte:可增强AI生成

MegaByte 方法使用多尺度解码器架构,能够对具有端到端可微分性的超过100万个字节的序列进行建模,这意味着以更低的运行成本获得更好的生成性能。

Meta的研究人员对基于Transformer的架构提出质疑。谷歌的研究人员在2017年开发了基于Transformer的系统,此后该系统被广泛用于NLP任务,为ChatGPT、GPT-4和BERT等模型和系统铺平了道路。

然而,Meta的团队认为,基于Transformer的系统处理复杂的输入,如书籍或播客,需要大量的计算才能运行。然而,MegaByte将输入和输出分成“补丁”而不是单独的token。每个面片都有自己的本地化响应,模型将这些响应与其他面片组合成一个整体,以创建最终输出。

研究人员建议,MegaByte“用子字模型给出有竞争力的语言建模结果,这可能允许字节级模型取代标记化”.

Meta新提出的架构得到了特斯拉人工智能总监安德烈·卡尔帕西(Andrej Karpathy)的称赞,认为这很有前景。

然而,对于MegaByte来说,现在还处于早期阶段,因为Meta的论文详细介绍了使用它进行的实验规模“远远低于最先进的语言模型”。研究人员提出,未来对MegaByte的研究应该探索将架构扩展到更大的模型和数据集。

0
免责声明:本文转载互联网,不代表本网站的观点和立场。如果你觉得好欢迎分享此网址给你的朋友。
文章标签

本文统计

  • 发布时间:2023-06-07 09:16
  • 修改次数:1
  • 修改时间:2023-09-15 10:33
  • 浏览热度:50
  • 评论数量:0
  • 点赞次数:0
评论
举报
验证码
发表

暂无评论,期待你的妙语连珠

举报文章问题
验证码
举报文章问题

已收到!

我们将尽快处理。