未来的“抖音神曲”将Made in AI？

2019年08月12日由 sunlei 发表 855003 0

7月24日消息，据国外媒体报道，字节跳动旗下的子公司抖音（海外名TikTok）又完成了一项收购。收购的对象为利用人工智能进行音乐编曲的英国初创公司－Jukedeck。

Jukedeck是谁？

Jukedeck成立于2012年，总部位于伦敦。在被抖音纳入麾下之前，Jukedeck开发了一款软件，该软件通过人工智能技术，根据用户自由选择的类型、曲风和时长，在几秒钟之内在线生成独特的音乐素材，自动为视频配乐。

Jukedeck不需要创作者懂得音乐或者编辑，便可随心所欲地创造属于自己的音乐。

Jukedeck 由 Stobbs 和 Ed Newton-Rex 在 2012 年共同创办，是一家音乐科技公司。在获得 “剑桥企业”（Cambridge Enterprise）基金与“剑桥创新基金”（Cambridge Innovation Capital）等多项融资后，Jukedeck在2015年推出基于人工智能合成技术的在线音乐创作应用 Jukedeck MAKE。

Jukedeck诞生至今，虽然规模不大，但一直致力于AI音乐技术的挖掘，追求音乐的个性化和民主化，努力让更多人体验到原创个性化音乐的乐趣。

Jukedeck目前由15个不同领域的工程师组成，有人工智能研究员、软件工程师、音乐家等等，他们都是既了解音乐、又懂人工智能的人才。

在抖音入局之前，Jukedeck已经拿到250万英镑的投资，主要来自剑桥创新资本（Cambridge Innovation Capital），其他投资方还包括Parkwalk Advisors、Backed VC、以及 Playfair Capital。

在国外著名APP LinkedIn上，记者发现Jukedeck 的CEO Ed Newton-Rex 和其他几名员工的资料已经显示他们是字节跳动的员工。而 Jukedeck也关闭了他们原有的网站，只留下一句话：“我们还不能告诉你更多信息，但我们期待继续使用音乐人工智能增强创造力！”很大可能是，Jukedeck会在将来将自己的智能生成音乐技术运用到抖音上，提高抖音用户的使用满意度和提高抖音视频的创造性和质量。

目前，Jukedeck的官网已经下线。

Jukedeck如何实现自动编曲

首先，进入Jukedeck的主页，会弹出一个设计简洁干净的对话框，让用户自行选择音乐类型，风格和音频时长。

[caption id="attachment_42780" align="aligncenter" width="484"]

“让我们来制作一段（＿）风格的，听起来（＿）感觉的，时长（＿）的音轨。” 这样的填空题，让人看了就想创作有木有[/caption]

在选择了想要制作的音频风格和时长之后，会进入一张属于你自己的音频制作界面。在这个界面的操作板上，可以根据提示的选项来制作和试听自动生成的音乐。目前Jukedeck的网站一共提供情绪，乐器，节奏三种音频生成的操作选项。

[caption id="attachment_42781" align="aligncenter" width="592"]

根据天气和情绪来制作音频的界面[/caption]

[caption id="attachment_42782" align="aligncenter" width="488"]

根据节奏类型来制作音频的界面[/caption]

之后就是音频的下载和使用了，Jukedeck为用户一共提供了3种选项套餐。其中有特定针对10人以下的小型团队以及个人用户的免费版本。说了这么多，让我们一起来听一听通过Jukedeck的所制作出来的音频。

[video width="1278" height="720" mp4="http://imgcdn.atyun.com/2019/08/抖音.mp4"][/video]

抖音携手Jukedeck，未来可期

事实上，抖音与2016年起源于中国，但是在2017年已经正式启动全球化战略，2018年，抖音在中国日活跃用户数超过2.5亿，抖音在美国下载量约为8000万次，在全球范围内达到8亿次。最新数据显示，抖音国际版TikTok已经覆盖了全球超过150个国家和地区，在40多个国家应用商店排名第一，每日观看人次达10亿。

App Annie数据显示，抖音海外版TikTok在日本、泰国、印尼和越南等国多次登顶当地App Store或Google Play总榜。

原本就很大的中国用户基数，加上让人恐怖的海外用户增长，让抖音具备了成为世界第一大短视频应用的基础。

抖音此次收购Jukedeck的行动，市场推测可能出于两个方面的考虑，第一是规避音乐版权、控制成本，提高利润空间；第二是拓展音乐产业的上下游市场，争夺话语权。同时抖音收购Jukedeck也反映了AI已经全面融入了内容创作领域。研究数据显示，AI将在2030年后给世界带来近100万亿人民币的净增全球GDP。AI技术研发和各个领域的商业落地应用，已成不可忽视的趋势和力量。

在互联网视频行业，内容输出是核心竞争力，而版权问题则是由来已久的商业风险。

利用AI技术实现自动编曲来化解版权困境肯定是一种趋势。但关键问题是，AI技术能否为用户继续带来“抖音神曲”般的上脑体验？能否为用户带来独特的创作快感？

例如，抖音此次收购的Jukedeck软件现在采用了深层神经网络来分析现有的大量音乐，并且通过这些训练数据群来发掘一些规律。而在一过程产生的旋律将会被包括马尔可夫链在内的系统适应和重新建立。

目前的AI编曲技术局限于利用曲谱的数据来进行学习，对于人声的识别和合成都尚有局限性。而且，相关行业的竞争商品虽然不断衍生，但是内容和技术其实都大同小异。

整体看来，我们可以明白此次的小收购虽然谈不上巨变，但的确能够带给了互联网视频行业一些启示，“未雨绸缪”提早利用科技规避版权风险。

从抖音收购Jukedeck，看AI内容创作新趋势

(1) AI写作

AI写作是一种“初级的机器辅助写作”工具，给AI一个关键元素、关键词，AI能够从数据库中检索，找到历史上所有涉及这个词语的文本，然后再以人类的自然语言进行表述，从而生成稿件。AI写作有两个特点：第一是逻辑分析目标数据，总结事实；第二是从大量信息中提取所需内容，并通过排列和组合形成文档。因此，人工智能写作显然受制于主题，适用于数据新闻或短期报道，而一些新闻公告对于机器人来说则无法写入。

2017年12月23日，今日头条自动写新闻机器人xiaomingbot荣获吴文俊人工智能科技发明奖，当年获得该奖项的机构还包括清华大学、中科院以及北京航空航天大学等国内顶尖高校。“吴文俊人工智能科学技术奖（以下简称‘吴文俊奖’）”被外界誉为“中国智能科学科技最高奖”，代表中国人工智能学界的重大突破与最高荣誉。今日头条是今年“吴文俊奖”获奖项目中唯一以企业载体获得专业类奖项的机构，打破了该奖只授予顶尖高校、重点实验室和科研机构的历史传统。

深圳智搜（Giiso）是专注于“人工智能+资讯”的代表企业之一，成立于2013年，自成立以来已获得三轮融资，领投机构包括金沙江创投、民银资本、力合金控等，融资金额达数千万元。公司有三款产品，分别为资讯机器人、机器人商店和天机联盟。Giiso资讯机器人是虚拟的、基于云存储的智能资讯引擎，具备机器写作、内容编辑、审核、个性化推荐与大数据追踪五大功能。而机器人商店则是基于大规模并行计算、分布式搜索引擎、智能爬虫及独特的语义分析技术，一站式的满足用户在语义分析、资讯聚合、自诩追踪、舆情分析、个性化推荐和实体抽取等个性化服务的开发平台。天机联盟依托Giiso智能语义技术，为企业搭建基于场景化资讯的内容运营体系，通过原生广告形态获取稳定收益。

(2) AI作曲

AI作曲，通俗来说就是自动化配乐，是一种基于人工智能的作曲工具。目前AI作曲可以根据现有少量的旋律进行分析然后搭配合适的背景音乐，让其变成一段具有主旋律和背景音乐的“完整乐曲”；另一种是帮助不太懂音乐的人创作属于自己的音乐，根据视频主题、时间、情绪的不同，进行个性化编辑，产生不同的音律。目前AI作曲带来的直观益处之一就是作曲门槛的降低和作曲的大众化，但是AI作曲短时间内不会让人类作曲家产生危机感。

Dmet Products就是总部位于东京的一家专注于“AI作曲”的公司，公司产品Ecrett Music是一个AI支持的工具，可以为视频生成独特的音乐音轨，每个月只需要花几美元，就可以为视频制作者持续产出高质量的音乐，听起来也非常自然。此外，谷歌和索尼也一直在做 AI 作曲方向，谷歌的 Magenta 和索尼的 Flow Machines 都有不少作曲。

(3) AI视频

AI视频，在某些领域算是一种视频处理工具。“AI+视频”可以独立完成从素材的搜集到视频的初剪、精剪、后期包装、渲染导出和发布，通过AI辅助用户创作视频。目前，AI视频应用在媒体机构、视频网站的短视频剪辑垂直类行业领域以及短视频制作和传播方面，可以节省大量的成本并缩短流量变现时间。

在AI+视频领域，不乏有大公司入局布阵。2018年阿里巴巴正式推出了一个“Alibaba Wood”，由阿里和浙江大学联合实验室共同研发，通过AI技术，首次打通了商品与人类的情感连接，1分钟内可以制作多达200个商品展示短视频。百度智能云更是一连发布了14款 ABC新产品，并升级了百度智能视频平台和3大视频行业解决方案。

慧川智能是制作“AI+视频云平台”的初创公司，2016年在杭州成立，经历A轮和B轮融资后，获得纪源资本、清流资本、头头是道投资等机构累计数千万的投资金额。公司主要通过打造人工智能在线云视频平台，帮助媒体机构的编辑记者提高视频制作效率。智影云平台能够帮助快速生成短视频，用户只需要输入脚本文字，就可以直接通过云端生成相应的视频内容，自动配音，并且用户可以在线进行编辑和修改，预览、渲染、视频文件导出和下载等全部在平台云端完成。

(4) AI作画

AI作画，是人工智能系统单纯透过文字智能分析，将文字转化成图像。它既可以作为漫画家和室内设计师的素描助理，也可以作为语音美化照片的工具，如果有更多的计算能力，这项技术能够根据电影剧本生成动画电影，进行一些重复且繁琐的手工绘画。此外，人工智能创作的画像并不一定在现实世界存在，只是电脑的一种想像，未来希望AI世界里的AI具有想象力，但是目前AI绘画只是刚刚起步。

Rokid是2014年在杭州成立的一家智能交互机器人研发商，2018年C轮融资1亿美元，领投机构有瑞士信贷、中华开发工业银行、IDG资本、淡马锡等。2018年11月29日上线了首款基于人工智能的微信小程序“达芬·若琪”,这款小程序可以智能识别用户上传的人像、动物、风景等八种类别的图片,并化身“AI画师”对图片进行艺术画创作。此外，目前微软宣称正计划推出一项新的人工智能技术——绘图机器人（drawing bot），使用者仅需说出想要绘制物体的名称，机器人便可以进行相关素材的匹配。

人工智能时代呼之欲出，也许未来我们还将共同迎接“超级智能时代”的机遇和挑战。未来我们会进入一个人与机器互相帮助、互相学习的时代。人让机器更聪明，但机器同时也可以帮助人释放更多的想象力、创造力，各行各业都能够用AI来重新定义我们的产业。

标签：

行业人工智能作曲

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇华为鸿蒙来了！可随时替代安卓，面向全球开发者开源

下一篇基于慢速脑动力，新型超速人工智能算法的学习效率超过现有算法

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）