大家看看这话是在攻击我吗？

5 年多

楼主 (北美华人网)

楼主是data scientist，在做一个卷积神经网络的模型。上周得到了初步的结果，每周例行的组会讲了一下。建完模之后，hold out的testing data效果很好。应用在了两组新的数据上，第一组数据效果也很好，效果和testing data很符合，第二组数据效果比第一组数据效果都差蛮多的。然后我就分析说，training data不够representitive，我们需要收集more diverse data set。然后我也说了，模式不能generalize well on all new data是个很关键的问题，如果没有解决，这个模型就不算成功。

然后我们开会的时候有个白人老头（不是我们组的）就说，这样的结果是因为your model is cheating! 然后就没有然后了。。。

当时我没多想，就说，你是想说model is overfitting？不是，我检查过learning curve，没有overfitting。而且根据我的经验，模式不能generalize well，没有overfitting，一般都是data的问题。training data不够具有代表性，然后我又分析了一下什么原因，应该怎么做。。。

事后我总觉得不对，感觉心里很不是滋味，这句话是在攻击我或者我做的工作吗？我老想发封邮件cc给老板，让他解释清楚他说的意思。不过想到这个时候大家都很烦，老板估计也不要管这些事情。上周开会的时候老板不在，在个人meeting的时候，老板说过模式用到新数据上效果就差在我们领域是个非常常见的问题。我为了别人这一句话发信给老板是不是太计较了？不过心里倒是不舒服。。。

WonderID

5 年多

妹子你心太软了，都这样了你还考虑他们有什么烦心事？这么难听的话他就会有麻烦，你可以先告诉老板再找HR。

stuart_minion

5 年多

he's racist

NoHostory

5 年多

钝感力是个好东西。少了好多无谓的烦恼。

stuart_minion

5 年多

yes report but don't waste time feeling bad

sssccc

5 年多

我觉得你回答得很好。这个老头是个jerk，别人也是知道的。但是没有必要再跟老板提了，move on。

zhegufei

5 年多

他歧视女性。

zhegufei

5 年多

他歧视Data Scientist。

史

史巴拉咕

5 年多

现在说不清了，应该当时就问清楚，'what do you mean?' 'can you elaborate?'

flyingplate

5 年多

白老头智商不够加性别歧视，下次当他放屁

chromium

5 年多

没必要去言语上你说我说去纠缠太多，因为没法用这个来对他怎样。多搜集些数据证明你的模型有用，别的人自然就明白谁对谁错了。到结果好了，召集上次参加会议的，总结一下，点出问题所在和你怎样解决的，化不利为有利，一个表现自己的好机会。这样一步步把自己的credit建立起来，同时团结大多数，他再这样会慢慢发现他自己给自己挖坑的。

Helicase

5 年多

我觉得你回答得很好。这个老头是个jerk，别人也是知道的。但是没有必要再跟老板提了，move on。
sssccc 发表于 4/4/2020 8:40:58 PM

我也觉得你回答的很好。老板肯定心里是有数的。可以和HR提下备个案，以防他以后再

WalnutTree

5 年多

你回答的非常好，估计其他人都明白。这次就算了，别气着自己，记住以后有机会反击这个老头。

xiaofengxian

5 年多

谢谢大家！一下子心里好受一点了。这个白老头从来不干活，每次组会都是提意见。但他又不是老板，有时候参加组会，有时候又不参加组会。搞不清楚这是个啥样的存在？为啥会这样？

xiaofengxian

5 年多

妹子你心太软了，都这样了你还考虑他们有什么烦心事？这么难听的话他就会有麻烦，你可以先告诉老板再找HR。
WonderID 发表于 4/4/2020 8:38:02 PM

怕老板烦心，我老板挺好的。遇到这样的问题，他说这是个典型的问题，我们领域很多人都会遇到这样的问题。看了隔壁贴，越加觉得自己的老板很nice。就是不想烦他，上次组会他不在。

Sjjdjr

5 年多

看老头当时说话的语气了还有他平时是什么样的人如果是开玩笑的语气没什么问题指的是这个model把人骗得团团转有时候model确实有很诡异的东西但是如果他说话的语气很认真或者他平时就不怎么友好那就是在说你了

eagletiger1

5 年多

楼主是data scientist，在做一个卷积神经网络的模型。上周得到了初步的结果，每周例行的组会讲了一下。建完模之后，hold out的testing data效果很好。应用在了两组新的数据上，第一组数据效果也很好，效果和testing data很符合，第二组数据效果比第一组数据效果都差蛮多的。然后我就分析说，training data不够representitive，我们需要收集more diverse data set。然后我也说了，模式不能generalize well on all new data是个很关键的问题，如果没有解决，这个模型就不算成功。

然后我们开会的时候有个白人老头（不是我们组的）就说，这样的结果是因为your model is cheating! 然后就没有然后了。。。

当时我没多想，就说，你是想说model is overfitting？不是，我检查过learning curve，没有overfitting。而且根据我的经验，模式不能generalize well，没有overfitting，一般都是data的问题。training data不够具有代表性，然后我又分析了一下什么原因，应该怎么做。。。

事后我总觉得不对，感觉心里很不是滋味，这句话是在攻击我或者我做的工作吗？我老想发封邮件cc给老板，让他解释清楚他说的意思。不过想到这个时候大家都很烦，老板估计也不要管这些事情。上周开会的时候老板不在，在个人meeting的时候，老板说过模式用到新数据上效果就差在我们领域是个非常常见的问题。我为了别人这一句话发信给老板是不是太计较了？不过心里倒是不舒服。。。

xiaofengxian 发表于 4/4/2020 8:33:27 PM

首先这个老外的态度有问题，应该就事论事，你的分析没有问题，着重提一下第二组数据，这组数据按照Training Data来讲是Outlier，这和Cheating无关，感觉提意见的认为你的参数设置参考了test data，结果就是你的test data结果还好，也没有明显的overfitting问题，但是在新的数据上结果不好，你可以说明一下Training的流程，提一下Training过程中没有碰test data，被人误会的时候要解释，尤其是这种指责，不然别人会觉得你有诚信问题，解释不是给这个指责你的人听的，我们是很难扭转有敌意的人的对我们的感官的，解释是给其他同事听的。

hercyna

5 年多

楼主是data scientist，在做一个卷积神经网络的模型。上周得到了初步的结果，每周例行的组会讲了一下。建完模之后，hold out的testing data效果很好。应用在了两组新的数据上，第一组数据效果也很好，效果和testing data很符合，第二组数据效果比第一组数据效果都差蛮多的。然后我就分析说，training data不够representitive，我们需要收集more diverse data set。然后我也说了，模式不能generalize well on all new data是个很关键的问题，如果没有解决，这个模型就不算成功。

然后我们开会的时候有个白人老头（不是我们组的）就说，这样的结果是因为your model is cheating! 然后就没有然后了。。。

当时我没多想，就说，你是想说model is overfitting？不是，我检查过learning curve，没有overfitting。而且根据我的经验，模式不能generalize well，没有overfitting，一般都是data的问题。training data不够具有代表性，然后我又分析了一下什么原因，应该怎么做。。。

事后我总觉得不对，感觉心里很不是滋味，这句话是在攻击我或者我做的工作吗？我老想发封邮件cc给老板，让他解释清楚他说的意思。不过想到这个时候大家都很烦，老板估计也不要管这些事情。上周开会的时候老板不在，在个人meeting的时候，老板说过模式用到新数据上效果就差在我们领域是个非常常见的问题。我为了别人这一句话发信给老板是不是太计较了？不过心里倒是不舒服。。。

xiaofengxian 发表于 4/4/2020 8:33:27 PM

平时和他熟吗，是个很mean的人吗？我觉得你当场回答的时候解释了generalizability和overfitting挺好的，顶多过后再确认一下没有data leakage？下次他再找麻烦，用很肯定的语气表明你的expertise就行了，如果他是个bully，被怼个几次就老实了。

lalo

5 年多

楼主的回答挺好的

utk

5 年多

不用太纠结，你做的没问题，我觉得他的话非常offensive，明眼人也都能看出来谁是jerk。事情过去就过去了，愿意和老板表达一下，就1:1时口头提一下，说一下你当时怎么处理的，看看老板有没有什么更好的处理方式推荐给你。我觉得职场上尽量避免正面冲突，自己心里对周围的人有个数就好，用自己的实力和人品结交“盟友”，至于这样的“敌人“，躲着就行了。

楼主是data scientist，在做一个卷积神经网络的模型。上周得到了初步的结果，每周例行的组会讲了一下。建完模之后，hold out的testing data效果很好。应用在了两组新的数据上，第一组数据效果也很好，效果和testing data很符合，第二组数据效果比第一组数据效果都差蛮多的。然后我就分析说，training data不够representitive，我们需要收集more diverse data set。然后我也说了，模式不能generalize well on all new data是个很关键的问题，如果没有解决，这个模型就不算成功。然后我们开会的时候有个白人老头（不是我们组的）就说，这样的结果是因为your model is cheating! 然后就没有然后了。。。当时我没多想，就说，你是想说model is overfitting？不是，我检查过learning curve，没有overfitting。而且根据我的经验，模式不能generalize well，没有overfitting，一般都是data的问题。training data不够具有代表性，然后我又分析了一下什么原因，应该怎么做。。。事后我总觉得不对，感觉心里很不是滋味，这句话是在攻击我或者我做的工作吗？我老想发封邮件cc给老板，让他解释清楚他说的意思。不过想到这个时候大家都很烦，老板估计也不要管这些事情。上周开会的时候老板不在，在个人meeting的时候，老板说过模式用到新数据上效果就差在我们领域是个非常常见的问题。我为了别人这一句话发信给老板是不是太计较了？不过心里倒是不舒服。。。 xiaofengxian 发表于 4/4/2020 8:33:00 PM

minren

5 年多

楼主是data scientist，在做一个卷积神经网络的模型。上周得到了初步的结果，每周例行的组会讲了一下。建完模之后，hold out的testing data效果很好。应用在了两组新的数据上，第一组数据效果也很好，效果和testing data很符合，第二组数据效果比第一组数据效果都差蛮多的。然后我就分析说，training data不够representitive，我们需要收集more diverse data set。然后我也说了，模式不能generalize well on all new data是个很关键的问题，如果没有解决，这个模型就不算成功。

然后我们开会的时候有个白人老头（不是我们组的）就说，这样的结果是因为your model is cheating! 然后就没有然后了。。。

当时我没多想，就说，你是想说model is overfitting？不是，我检查过learning curve，没有overfitting。而且根据我的经验，模式不能generalize well，没有overfitting，一般都是data的问题。training data不够具有代表性，然后我又分析了一下什么原因，应该怎么做。。。

事后我总觉得不对，感觉心里很不是滋味，这句话是在攻击我或者我做的工作吗？我老想发封邮件cc给老板，让他解释清楚他说的意思。不过想到这个时候大家都很烦，老板估计也不要管这些事情。上周开会的时候老板不在，在个人meeting的时候，老板说过模式用到新数据上效果就差在我们领域是个非常常见的问题。我为了别人这一句话发信给老板是不是太计较了？不过心里倒是不舒服。。。

xiaofengxian 发表于 4/4/2020 8:33:27 PM

他应该是对专业，不必计较，例如：
https://chatbotslife.com/deep-learning-in-7-lines-of-code-7879a8ef8cfb
We now can use our model to predict output. Be sure to remove any test patterns from your training data (comment out lines containing the patterns you want to test), otherwise the model is cheating.

the model “is cheating” by backtesting using “familiar” data

xiaofengxian

5 年多

平时和他熟吗，是个很mean的人吗？我觉得你当场回答的时候解释了generalizability和overfitting挺好的，顶多过后再确认一下没有data leakage？下次他再找麻烦，用很肯定的语气表明你的expertise就行了，如果他是个bully，被怼个几次就老实了。

hercyna 发表于 4/4/2020 9:00:18 PM

不熟。。。平时很少接触，他有时候参加组会有时候又不参加。data leakage是个很重要的问题，我在讲slides的时候解释过TESTING DATA怎么取的，强调过它的独立性。回答问题的时候应该再强调一遍的。

hercyna

5 年多

不熟。。。平时很少接触，他有时候参加组会有时候又不参加。data leakage是个很重要的问题，我在讲slides的时候解释过TESTING DATA怎么取的，强调过它的独立性。回答问题的时候应该再强调一遍的。

xiaofengxian 发表于 4/4/2020 9:18:09 PM

那他说话在组里有分量么？还是说就是个摆设找存在感？我觉得啊，坏事变好事，可以借着这个机会画大饼，跟你老板1 on 1的时候，讲一下你做的这个model往下有很多可做的。
除了你说过的那些，讲讲怎么quantify data similarity啊，是不是要往continual learning走啊，model ensembles啊，等等的，对强化你的technical leadership肯定有好处。

xiaofengxian

5 年多

首先这个老外的态度有问题，应该就事论事，你的分析没有问题，着重提一下第二组数据，这组数据按照Training Data来讲是Outlier，这和Cheating无关，感觉提意见的认为你的参数设置参考了test data，结果就是你的test data结果还好，也没有明显的overfitting问题，但是在新的数据上结果不好，你可以说明一下Training的流程，提一下Training过程中没有碰test data，被人误会的时候要解释，尤其是这种指责，不然别人会觉得你有诚信问题，解释不是给这个指责你的人听的，我们是很难扭转有敌意的人的对我们的感官的，解释是给其他同事听的。

eagletiger1 发表于 4/4/2020 8:59:12 PM

mm很专业！这个我在讲slides的强调过。回答问题的时候再强调一遍更好。

xiaofengxian

5 年多

那他说话在组里有分量么？还是说就是个摆设找存在感？我觉得啊，坏事变好事，可以借着这个机会画大饼，跟你老板1 on 1的时候，讲一下你做的这个model往下有很多可做的。
除了你说过的那些，讲讲怎么quantify data similarity啊，是不是要往continual learning走啊，model ensembles啊，等等的，对强化你的technical leadership肯定有好处。

hercyna 发表于 4/4/2020 9:26:33 PM

没啥分量，最后还是老板说了算。。。
mm你说的这些都很关键！我也是这么想的，要是组里都是你这种同事就有很多交流的火花，哈哈哈哈哈！

majia666

5 年多

回复 1楼xiaofengxian的帖子 “model is cheating!” 在你这专业上，是不是有这个说法？如果从一般谈话上， CHEATING 是个很严重的词。

hercyna

5 年多

没啥分量，最后还是老板说了算。。。
mm你说的这些都很关键！我也是这么想的，要是组里都是你这种同事就有很多交流的火花，哈哈哈哈哈！

xiaofengxian 发表于 4/4/2020 9:29:18 PM

哈哈哈我有限的经验是亚裔女生一上来多多少少的都有点被轻视或者不信任，我们自己气势不能输，专业上更没啥怕他们的啦，另外就是老板清楚你的贡献肯挺你最重要！

xiaofengxian

5 年多

回复 1楼xiaofengxian的帖子

“model is cheating!” 在你这专业上，是不是有这个说法？
如果从一般谈话上， CHEATING 是个很严重的词。
majia666 发表于 4/4/2020 9:31:26 PM

我不觉得啊。。。专业人士都知道建模很辛苦的，尤其是模式generalization的问题，很多时候数据不够也没办法。建模初期也不会知道哪些数据就够了，哪些不够。back and forth再finalize模式是个很正常的过程。。。不会用这个词来攻击别人建的模式的。

xiaofengxian

5 年多

不用太纠结，你做的没问题，我觉得他的话非常offensive，明眼人也都能看出来谁是jerk。

事情过去就过去了，愿意和老板表达一下，就1:1时口头提一下，说一下你当时怎么处理的，看看老板有没有什么更好的处理方式推荐给你。

我觉得职场上尽量避免正面冲突，自己心里对周围的人有个数就好，用自己的实力和人品结交“盟友”，至于这样的“敌人“，躲着就行了。

utk 发表于 4/4/2020 9:04:06 PM

认同，告诉自己要内心坚定有力量。谢谢mm慧言！

tseco

5 年多

感觉是在攻击lz。这种的在公开场合态度诚恳地讨教，就像你做的，我觉得挺好。他要不说话，别人也能看出是他的问题。私下交流他要还这个态度，不理他就是。他要一再主动找你麻烦就找他hr。

aiyamayayongle

5 年多

回复 21楼minren的帖子 楼主大概不会接受这个说法。看得出来，楼主看不惯这个老头有一阵子了。

happymc

5 年多

这个人是干嘛的啊？为啥在你们的组会发言。这个人明显故意的。如果是做cross validation不可能存在cheating的问题，他要再找茬就直接问 Why do you think the model is cheating while the test data is never included in the training set?

zeeree

5 年多

现在说不清了，应该当时就问清楚，'what do you mean?' 'can you elaborate?'
史巴拉咕发表于 4/4/2020 8:42:18 PM

今

今生无悔

5 年多

首先这个老外的态度有问题，应该就事论事，你的分析没有问题，着重提一下第二组数据，这组数据按照Training Data来讲是Outlier，这和Cheating无关，感觉提意见的认为你的参数设置参考了test data，结果就是你的test data结果还好，也没有明显的overfitting问题，但是在新的数据上结果不好，你可以说明一下Training的流程，提一下Training过程中没有碰test data，被人误会的时候要解释，尤其是这种指责，不然别人会觉得你有诚信问题，解释不是给这个指责你的人听的，我们是很难扭转有敌意的人的对我们的感官的，解释是给其他同事听的。

eagletiger1 发表于 4/4/2020 8:59:12 PM

是的，对方的态度很不专业，但是你用专业的态度去对待就很好。觉得你当时的应对很好。不必要进一步解释，以后提防一下这个老头就好了，同时注意保持专业的态度。

吃

吃瓜群众11

5 年多

楼主当场解释的很好，公众发言永远要就事论事。对方说cheating，绝对是理亏。楼主不想咽这口委屈气的话，就要找出这老头为啥“胆敢”说出cheating这个词的原因。他是否是对你？还是对你老板？还是因为对你是华人等等。我公司里这种资历老，嘴巴管不严，牛鼻烘烘还觉得自己brutally honest的老头很多，最后都是走人。这种人犯这样的低级错误，大概也干不长了。

luna930

5 年多

楼主的反应应该是最好的了。如果是我肯定玻璃心碎了，当场就take it personally了，也许我会反击回去，但是会显得很小气，而且让大家都尴尬。楼主的回答让这个老头攻击扑了个空，替他把一个非常有攻击性的问题转换成了一个可以有建树性答案的问题。非常高明。MM不用担心，你老板肯定非常为你骄傲

lilimarah

5 年多

你当时应该问他什么意思啊？为啥帮他解围说overfitting。如果没听错的话

lilimarah

5 年多

楼主的反应应该是最好的了。如果是我肯定玻璃心碎了，当场就take it personally了，也许我会反击回去，但是会显得很小气，而且让大家都尴尬。楼主的回答让这个老头攻击扑了个空，替他把一个非常有攻击性的问题转换成了一个可以有建树性答案的问题。非常高明。MM不用担心，你老板肯定非常为你骄傲
luna930 发表于 4/5/2020 9:06:25 AM

我不觉得这是最好的反映。lz应该做的的确不是马上fight还击但是要问问他的什么意思让他露马脚，会上那么多人都可以作证啊

今

今生无悔

5 年多

首先这个老外的态度有问题，应该就事论事，你的分析没有问题，着重提一下第二组数据，这组数据按照Training Data来讲是Outlier，这和Cheating无关，感觉提意见的认为你的参数设置参考了test data，结果就是你的test data结果还好，也没有明显的overfitting问题，但是在新的数据上结果不好，你可以说明一下Training的流程，提一下Training过程中没有碰test data，被人误会的时候要解释，尤其是这种指责，不然别人会觉得你有诚信问题，解释不是给这个指责你的人听的，我们是很难扭转有敌意的人的对我们的感官的，解释是给其他同事听的。

eagletiger1 发表于 4/4/2020 8:59:12 PM

赞一下这个。

kengdie

5 年多

建议楼主多看看behavior question，里边有各种各样处理问题的方式，看看答案上怎么说的

今

今生无悔

5 年多

我不觉得这是最好的反映。lz应该做的的确不是马上fight还击但是要问问他的什么意思让他露马脚，会上那么多人都可以作证啊

lilimarah 发表于 4/5/2020 10:23:38 AM

嗯，我也觉得就让他elaborate，让他自己出丑，然后再针对他的回答做出相应的回应。

coconutjuice

5 年多

第二批不好的数据应该不是全部不好吧，把那些不好的个例挑出来，看看是什么原因。加 augmentation.如果数据搜集很难的话模型总有新数据预测不好的，有很多文章做模型的更新以前active learning,把预测不好的数据加到训练数据。现在有一些文章做long time learning, 可以看看

lilimarah

5 年多

我不觉得这是最好的反映。lz应该做的的确不是马上fight还击但是要问问他的什么意思让他露马脚，会上那么多人都可以作证啊

lilimarah 发表于 4/5/2020 10:23:38 AM

嗯，我也觉得就让他elaborate，让他自己出丑，然后再针对他的回答做出相应的回应。

今生无悔发表于 4/5/2020 10:26:48 AM

对啊，就算他不是真实的告诉你他这么说的原因，但是还是会暴露他的intention的

denis_sis

5 年多

妹妹我觉得你做的很好，用professional 方式,如果下次他再说可以直接Confront 说他说的make you uncomfortable and inappropriate 报告HR。

xiaofengxian

5 年多

谢谢大家！mm的专业意见和危机处理建议都很管用，我自己学到不少！

lianzi

5 年多

我觉得你回答得很好。估计他就是那个意思，有时候我们说overfitting的时候也会开玩笑说是cheating。所以他说你的模型在cheating，不是说你在cheating。