谷歌DeepMind推出Mixture of Depths

Fri 05 April 2024

日前有消息显示，谷歌DeepMind方面发布的Mixture-of-Depths（MoD），改变了以往Transformer架构的计算模式。

据了解，通过动态分配大模型中的FLOPs（运算次数或计算资源），优化不同层次模型深度中的分配，限制给定层的自注意力和MLP计算的token数量，MoD可跳过一些不必要计算，迫使神经网络学会主要关注真正重要的信息，实现只给需要准确预测的token分配更多计算资源，从而显著提高训练效率和推理速度。

例如，虽然预测下一个句子的内容很难，但预测句子结束的标点符号很简单，如果给两者分配同样的计算资源，那么后者明显会浪费资源、而MoD则可避免这种情况。

据谷歌方面发布的相关测试结果显示，在等效计算量和训练时间上，MoD每次向前传播所需的计算量更小，而且后训练采样过程中步进速度提高50%。

据了解，谷歌研究团队还探讨了MoD和MoE结合的可能性MoDE，而且结果表明而这一结合能提供更好的性能和更快的推理速度。

此外值得一提的是，为解决AI幻觉问题，不久前谷歌DeepMind还与斯坦福大学联合开了一款AI事实核查工具"搜索增强事实评估器"（Search-Augmented Factuality Evaluator，SAFE）。

据了解，SAFE可通过四个步骤对AI聊天机器人生成的回复进行分析、处理和评估，以验证其准确性和真实性。具体而言，SAFE首先会将回复分割成多个单个待核查内容、对上述内容进行修正，然后再与谷歌搜索结果进行比较。随后，SAFE还会检查各个事实与原始问题的相关性。

为评估SAFE性能，谷歌方面的研究人员还创建了包含约16000个事实的数据集LongFact，并在包括Claude、Gemini、GPT、PaLM-2在内的13个大语言模型上测试了这一工具。结果显示，在对100个有争议事实进行的重点分析中，SAFE的判定在进一步审查下正确率达到76% 。与此同时，SAFE还具备显著的经济性优势，即其成本比人工注释便宜20多倍。

稿源：新浪网

::: {.previous_content} « 上一篇 OpenAI放开限制，无需注册可使用ChatGPT :::

::: {.next_content} 下一篇 » 暴雪网易官宣回归：200万人预约《魔兽世界》 :::

OpenAI放开限制，无需注册可使用ChatGPT

马斯克旗下大模型Grok宣布开源

全球首部AI电影在美国首映

全球首个AI程序员Devin诞生

谷歌高级副总裁为AI模型Gemini道歉

周鸿祎谈OpenAI大模型Sora

谷歌承认Gemini演示视频是剪辑版

谷歌发布最新人工智能模型Gemini

OpenAI人事震荡

谷歌DeepMind创始人提出通用人工智能分级

马斯克旗下AI公司推出首个大语言模型将与推特深度整合

百度推出付费文心一言专业版

美国将就降低人工智能风险采取"最强有力的行动"

美国商务部澄清：RTX 4090显卡可在中国零售不能生产

《生成式人工智能服务安全基本要求》公开征求意见

ChatGPT更新将支持图片和语音输入

OpenAI 有望推出多模态 GPT 模型

ChatGPT成功诊断4岁男孩怪病，击败17位医生

《时代》发布全球百大AI人物

百度文心一言宣布向社会全面开放

::: {.sidebar-box .clearfix}

网站分类

::: {.sidebar-box .clearfix}

热文排行

::: {.sidebar-box .clearfix}

站点统计

文章总数:7421
评论总数:199354
浏览总数:70708758
当前主题:SimplePro :::

Category: 月光博客2024

Fri 05 April 2024

相关文章

网站分类

热文排行

站点统计