NVIDIA发布TensorRT 4，极大加速神经机器翻译

登录注册

行业学习

支撑

数据算量系统

企业招聘智能体

下载

模型数据集

AI工具箱

企业服务

EVA 智能HR

ChatGPT 人工智能应用人工智能未来计算机视觉

热门新闻

公司板科大讯飞

科大讯飞包揽ICPR MTWI图文识别挑战赛三项冠军

行业人工智能

所以，能动手就别吵吵了

行业人工智能

人工智能对 IT 技能和人才发展的影响

常用工具

ChatGPT

OpenAI旗下AI对话工具

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Midjourney

AI图像和插画生成工具，测试测试测试测试测试测测试

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

您尚未登录账户

请先登录您的atyun账户，方可使用该功能

仅限企业账户使用

该功能仅限企业账号使用，开通企业账号可享受更多服务，是否现在注册企业账号？

立即注册企业账号

暂不需要

您的企业账号申请正在审核中

审核通过后即可使用此功能，请耐心等待~

2018年07月19日由浅浅发表 233221 0

NVIDIA发布了TensorRT 4，其新功能可加速GPU上神经机器翻译（NMT）应用的推断。

神经机器翻译为大量消费应用提供基于AI的文本翻译，包括网站，道路标志，外语字幕等。

TensorRT是NVIDIA的可编程推理加速器，可帮助优化和生成运行时引擎，以便将深度学习推理应用程序部署到生产环境中。谷歌的神经机器翻译（GNMT）模型与仅使用CPU的平台相比，使用TensorRT在Tesla V100 GPU上的推理速度提高了60倍。

新的TensorRT 4版本支持新的RNN层，如Batch MatrixMultiply，Constant，Gather，RaggedSoftMax，Reduce，RNNv2和TopK。这些层允许应用程序开发人员使用TensorRT轻松加速NMT模型中计算密集程度最高的部分。

NVIDIA发布TensorRT 4，极大加速神经机器翻译

NMT详细示例图。编码器、发电机和波束调整作为三个TensorRT引擎。在橙色缓冲区中，由用户分配。在GPU和CPU上分别实现绿色和蓝色的层。

在性能方面，当在数据写入器基准测试组件上测试光束搜索时，系统在batch= 1的推理期间执行的速度比仅用CPU快170倍，比batch= 64的速度快100倍。

NVIDIA的可编程推理加速器TensorRT帮助优化和生成运行时引擎，将深度学习推理应用部署到生产环境中。

与只使用cpu的平台相比，GNMT模型在特斯拉V100 GPU上使用TensorRT的速度更快。

标签：

行业算量英伟达NVIDIA

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇福布斯与英特尔公司合作推出刊物Forbes AI，围绕AI进行深度探讨

下一篇苹果人才不断流失：Siri创始人退休，搜索主管Prakash离职

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）