机器学习工业界和学术界的差别越来越大了吗？尽早实习和踏实科研各有什么利弊？

2019年01月25日由荟荟发表 634986 0

体验有很多，个中心酸不足为外人道也。

记一次长驱直入的论文复现过程...... 机器学习工业界和学术界的差别越来越大了吗？尽早实习和踏实科研各有什么利弊？

做科研和做实际工程，最大的区别在于：对！需！求！的！理解！不同！

工程领域是什么样的呢，举个例子。不知道有多少人写过工程项目申请书，一般来说逻辑是这个样子的。

“首长们要做这件事，这件事很重要，需要一个系统来辅助他，国外已经有很多成熟的系统了，我们要奋起直追（意义和国内外现状）。做这件事需要XXX，而XXX可以用A做，也可以用B做，也可以用关联规则做，其中关联规则用得最广，你看这个系统是用关联规则做的，那个系统也是用关联规则做的，所以我们也用关联规则（内容和可行性）。我们团队做关联规则很有实力，请给经费吧，我们一定会把项目做出来的（研究基础）。”

看到没？工程项目的需求是：“用最稳妥的方法，尽可能控制风险，辅助某人或某个团体完成另一件事”

而这两者的区别在实际操作中所体现出来的就是：你用写项目申请书的方法写论文绝对被拒稿。（别人都做过了你这个研究的创新点在哪里呢？没有意义阿）
同样，你用写论文的方法写项目申请书绝对一分钱拿不到。工业界基本遵循奥坎姆剃须刀原则，在不牺牲很大性能的情况下，更加愿意选择简单，稳定性强，可解释性强，可维护性好的算法与模型。本身根本不会像kaggle那样追求那么高精准的结果。

机器学习工业界和学术界的差别越来越大了吗？尽早实习和踏实科研各有什么利弊？

建议：搞科研的去干工程可以，搞工程的去干科研就算了，简直要了亲命。

原因就在于知识储备。当你浸淫于“找别人没玩过的去玩”很多年以后，你会发现，基本上这个世界上你所在领域的所有的玩法你都门清。哪些成熟、哪些有缺陷，哪些适合A，哪些适合B。

当然，事无绝对，在数据挖掘与机器学习领域，还是有很多三区四区期刊是以工程为导向的，虽然没有工程申请书那么那么的接地气，但要好很多。当然，这些期刊知乎大神们是不会看上的。

搞科研能让你逐渐扩充领域内的知识储备，如果以后搞工程也容易转行。搞工程能让你更熟悉甲方要什么，但是这项优势平心而论保持不了多久，且主要靠“基于人脉的垄断”来维持。

“落后的工业水平，跟不上科研产物”

机器学习工业界和学术界的差别越来越大了吗？尽早实习和踏实科研各有什么利弊？

大多数人们所谓的算法指的是学术研究上提出的理论，普遍的问题就是看起来很美好，落地很困难。研究成果商业化周期的滞后。学术界的研究成果，在能够商业化前还有很长的路要走。早在思必驰的一次采访中，周伟达的就与记者大吐过这样的苦水：“还有相当一部分的算法停留在实验室里。我们虽然在技术上做了验证，但没法在目前的硬件平台上落地。“周伟达举了这样的一个例子：“比如，在 2015 年时，我们提出多麦克风阵列设计，我们自己设计了代码，然后去跟芯片厂家提出芯片接口是否能增加六个、八个麦克风，因为当时的 SOC 芯片一般只有左右两个通道的麦克风。但芯片厂商的迟疑是「你们确认有这个需求吗？」这些需求或许在他们看来是不可思议的。最后我们没办法，直接去用 FPGA 这种可编辑的硬件器件自己搭了一个 demo，向客户演示是双麦还是六麦效果更好，如果六麦效果更好，那芯片是否应该支持。所以作为技术提供商我们去要去硬件平台非常费劲！”

文章转载自：https://www.zhihu.com/question/63883029/answer/227297046

标签：

机器学习机器学习工程师

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇亚马逊开源Neo-AI，提高优化机器学习模型的效率

下一篇 8 个机器学习数据清洗 Python 代码，简洁实用！

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）