• Welcome to the world's largest Chinese hacker forum

    Welcome to the world's largest Chinese hacker forum, our forum registration is open! You can now register for technical communication with us, this is a free and open to the world of the BBS, we founded the purpose for the study of network security, please don't release business of black/grey, or on the BBS posts, to seek help hacker if violations, we will permanently frozen your IP and account, thank you for your cooperation. Hacker attack and defense cracking or network Security

    business please click here: Creation Security  From CNHACKTEAM

人工智能就业前景越来越严峻 你还在坚持吗?


Recommended Posts

2019年,我个人几乎没有追求过什么前沿的NLP机型,各种BERT和transformer也是通过微信官方账号里的新闻知道的。我主要认为这些模型需要大量的标注数据,这在中文医学文本行业几乎是不可能的。其次,实际效果能提高多少是个未知数,医生是否接受也是个挑战。我越来越觉得AI掉进了一个大牛挖坑,小牛填坑,工程师调参,外行将信将疑的境地.大家都关注工具属性,却很少有人关注落地属性。不过作为技术人员,2020年可能要补上。2019年因为响应各种需求接了一些货,学习了neo4j、arangodb等nosql数据库,以及dashboard的web开发和自动部署的docker开发,还学习了点异常检测和测量学习。唯一的目的就是找到更多客户真正认可和关注的方向。一切都很复杂,脑子有点乱。有一次,我在R中用str()把它转换成

https://www.zhihu.com/question/352212884/answer/961998310

那是肯定的。不坚持,连饭都吃不下。

2019年,我为公司面试了很多人。超过1个半小时的应该有100多人,但录用的不超过5人。结合我自己在公司内部的工作,基本上可以说,至少在' ' AI '行业,2019年不仅就业前景严峻,从业者的前景也是严峻的。

17年前,我在互联网行业打拼。虽然加班,但基本上保住了自己的一亩三分地,有点压力,其他的也不用问。17年进入智慧医疗创业,负责很多事情,从前端到后端,从产品到市场,都要操心,但基本上技术是主流。所以17年18年基本都是在技术和数据上学习。19年真正开始落地,主动被动要学的东西很多,真的觉得比换包叠层难多了。无论是'互联网'还是' AI ',垂直行业的关节都比想象中复杂得多。用咨询行业常说的一句话:客户要的是解决方案,而不是模型。模型是实验室的产物,解决方案是营销的结果。解决方案意味着产品化和工程化的思维方式。

除了传统意义上的产品设计和用户体验,产品化是指符合垂直行业的商业逻辑。这对于纯计算机行业的人来说,其实是很难的。一方面计算机专业毕业的学生肯定没有这方面的知识,另一方面愿意学习的人几乎没有。说白了,只有生物医学专业人士或者有相关经验的人,才能真正设计出符合医学逻辑的产品。而这恰恰是落地的关键。我个人负责医学文本的方向。我举个简单的例子。预测肝癌预后有一些指标,如分化程度、切缘、病理亚型等。我们可以建立一个模型来预测它。第一个问题是用什么模型。准备好去AutoML了吗?线性回归、SVM和深度模型其实都不太好。医生最喜欢决策树,因为在临床上容易落地。第二个问题是,应该用什么指标?如果完全按照模型的结果来筛选指标,基本上失败了一半。最好的解决办法是先征求医生的意见。有先验知识要用,却不去用,太浪费了。以肝癌为例。事实上,上述所有指标都与预后有关,但MVI微血管侵犯最好。因为2015年国内指南明确推荐使用这个指标,而且有明确的临床意义。智慧医疗行业有很多这样的事情,甚至有些不合理。近年来,在深度学习方向,端到端的学习方法备受推崇,这在某种意义上给黑盒属性和不可解释性披上了一层冠冕堂皇的外衣。我不是说端到端不好,只是这种完全忽略业务逻辑的模型范式并没有被业界普遍接受。尤其是决策现场,非常重视过程。过程没有意义。roc再好。

2019年对工科的要求更加迫切。我记得,之前有一篇文章提到,AI创业公司的制胜关键不是模型,而是工程能力。其实国内很多互联网医疗或者智慧医疗创业公司的工程能力应该都不强。我的结论是基于对一些代表性产品的调查分析。我们自己外包人员的反馈,以及医院药企对朋友的评价,也支持了这种认识。应该说这些公司的算法能力可能和大企业差不了多少。毕竟很多人都是从大企业挖过来的。但是工程能力差。可能和很多有经验的开发者不愿意去小公司或者被忽视有关,也和2C这样的高性能并发场景需求不大有关。个人觉得招一个合适的发展还是挺难的。从本质上来说,创业公司的开发者最好一开始就有一个全栈,即使没有全栈,也能理解前端和后端的概念和接口。这种要求不是三年经验就能练出来的。另外,医疗领域对数据安全性和稳定性的考虑几乎是第一位的,有时候有点不可抗力。2019年,个人伦理审查已经通过,项目已经正式开始,但最终被首席PI院长叫停,原因是数据不在私有云上。这种谦让的事情都是医院做的。在某种程度上,这似乎是医院大山的结果。还有一个体验就是很多创业公司喜欢用各种软件的开源版本或者社区版本。但是,这些版本的灵活性和性能会受到影响(有些版本只能支持单个帐户登录或只挂载一个数据库)。如果公司不愿意花钱,没有真正的工程人员参与,这些产品基本都是半成品。

围绕这一解决思路,2019年由于

为AI落地的事情占用了我大量的时间,技术方面主要是数据安全,知识产权和招聘。哪一个环节都不敢怠慢。数据安全很好理解,医院需要数据安全存放,药厂需要规避数据安全风险,监管机构需要数据安全方案。但是你要知道,目前的安全等保和HIPAA等,更多的是在用流程控制安全。公司要想提高数据安全除了物理隔离,加密,灾备,更多时间是在准备各种文档说明自己的生产过程符合安全规章制度。当一个领域无法用技术提升时,通常会采用过程管理。这东西非常像软件成熟度模型CMM,试问哪个IT人员愿意花时间在这上边。知识产权的问题主要是和医院药厂合作完成项目时的文章,算法,产品的产权分配。最一般的场景是,医生给你标注了数据集,你拿来训练深度模型,又发了文章,开发了产品。专利律师的理解是,这种情况下对方是否有权利要求知识产权目前完全看双方协商。其实从公司层面,多挂一个名字也没什么,主要是怕让甲方误会,曲解,影响了业内口碑啊。而且在AI爆棚的时期,发专利也并不难。招聘的事情,今年也废了老大劲。所以我说就业前景是严峻的。最深的感触是很多自称是算法工程师的人骗面试,最大的特点是专业非计算机,数据或统计出身,简历上各种“熟悉”,“精通”模型框架,加上泰坦尼克号项目经验。我个人又非常喜欢问基础问题,例如讲一个聚类算法或解释一下tfidf,瞬间露馅。还有些自称精通python的人,答不上来yield和return的区别,或者python的向量化操作。我是真的累了。我差点给hr训练一个基于简历的虚假申请者分类器。

2019年,我个人几乎没有在追什么前沿的NLP模型,各种BERT,transformer也是通过公众号的新闻了解。我主要觉得这些模型一来需要大量标注数据,这在中文医疗文本行业内几乎不可能;二来实际效果能有多大提升也未可知,医生是否接受也是个挑战。我越来越觉得AI掉进了一个大牛挖坑,小牛填坑,工程师调参,外行将信将疑的境地。大家都在关注工具属性,很少人关注落地属性。不过作为技术人员2020年可能还是要补一补。2019年因为响应各种需求也有些收货,学习了neo4j,arangodb等nosql数据库,还有面向仪表盘的web开发,自动化部署的docker开发,还研究了点异常点检测和度量学习。唯一的目的就是希望能发现更多的方向是客户真正认可和关注的。东西都学杂了,脑子有点乱。有一次,在R里用str()想转换为字符串(python里str()是用来转换为字符串的,而R里str()是返回数据框结构的),一时没有发现。

我在知乎另一个回答中提了很多机器学习在医疗领域的坑。

当前(2019年)机器学习中有哪些研究方向特别的坑?325 赞同 · 38 评论回答

其实我本人是希望大家都能理性看待AI的能力和前景。如果有机会,我甚至会写一个‘机器学习有哪些非常有意义的研究方向?’的回答。AI的2B业务和传统互联网中业务完全是两码事,尊重行业积淀,尊重兄弟学科是一个基本前提。不可否认,很多传统行业和制造业,例如AI最火的安防,自动驾驶和智慧医疗可能都深受社会制度和甚至行业痼疾的影响,你要进来,面对的不是一个企业,而是一个链条。

作为计算机出身的人,我自然希望AI能大放异彩。但是这个行业混进来一些浑水摸鱼的人,一些过于乐观的人,还有一些只想赚快钱的人。而坚持不仅仅是一种态度,更多的是一种能力,未来必然会有一些企业‘化作春泥更护花’。

 

 

Link to comment
Share on other sites