Google推出改进文本分类和模型训练的AutoML自然语言

2019年12月15日由 TGS 发表 194127 0

今年早些时候，谷歌发布了AutoML Natural Language，这是其云自动机器学习平台到自然语言处理领域的扩展。经过数月的Beta测试，AutoML今天面向全球客户推出了通用版，支持分类、情绪分析和实体提取等任务，以及一系列的文件格式。

AutoML Natural Language可以利用机器学习来揭示电子邮件、聊天日志、社交媒体帖子等文本的结构和含义。它可以从上传和粘贴的文本或谷歌云存储文档中提取关于人、地点和事件的信息，它允许用户训练自己的自定义AI模型，对情绪、实体、内容和语法等进行分类、检测和分析。此外，它还提供了自定义实体提取，从而可以在文档中标识那些没有出现在标准语言模型中的、特定于域的实体。

AutoML Natural Language有超过5000个分类标签，并允许对多达100万个文档进行培训，文档的大小最大可达10MB，谷歌说，这使得它非常适合“复杂”的用例，比如：理解法律文件，或是对具有大型内容分类法的组织进行文档分割。

此外，谷歌表示，AutoML Natural Language现在已经获得Fedramp的中度授权，这意味着它已经根据美国政府的规范进行了审查，以获取损失影响有限或严重的数据。它表示，这一功能，加上新引入的允许客户创建数据集、训练模型和预测的功能，能够同时将数据和相关的机器学习处理保持在单个服务器区域内。

赫斯特集团已经在使用AutoML Natural Language来帮助组织其国内和国际杂志的内容，日本出版商日经集团(Nikkei Group)也在利用AutoML Translate来发布不同语言的文章。Chicory是第三个早期采用者，利用它为Kroger、亚马逊(Amazon)和Instacart等杂货零售商开发定制数字购物和营销解决方案。

谷歌自然语言产品经理在博客上表示：最终目标是为需要定制机器学习模型的组织、研究人员和企业提供一种简单、无需修饰的培训方式。自然语言处理是揭示文本结构和意义的宝贵工具，可以通过更好的微调技术和更大的模型搜索空间，不断提高其模型质量。

标签：

行业谷歌

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌利用人工智能改善搜索结果

下一篇 2019全球AI报告：中国论文数量全球第一

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）