Menu

机器学习验证集为什么不再有新意

0 Comments

机器学习中,一般将样本数据分成独立的三部分:训练集、验证集和测试集。

其中验证集在机器学习中所起到的作用是:开发模型总需要调节模型的参数,而整个调节过程需要在验证集数据上运行训练的模型,从而给出其表现的反馈信号来修改网络模型及参数。

也因此,无论制造业、抑或批发零售业,在2月份招聘需求量便“水涨船高”。其中,尤其是线上零售企业由于人手极为短缺加之单量持续增长,甚至出现“共享员工”的新业态。

“以往春节前后是店里二手手机的销售高峰期,特别是节后,从外地回来的很多务工人员会到店里买卖手机,但现在节奏被打乱了。”徐子君最乐观的估计,是在3月中旬回到市场,然后尽快把这段时间和客户在微信里谈好的订单发货。与此同时,他也在寻找其他货源渠道。

对于该问题的回答当然是肯定的。这会导致验证集过拟合,并且这已经不是新鲜事了。这里本文我尝试探索一些方法来思考为什么会发生这种情况,并希望通过这样做,还能开辟出一条更深入地理解过拟合和数据划分的道路,而不仅仅是讨论上面这两个人们为准备面试而需要了解的命题陈述。

和所有人一样,他们很清楚,生活还要继续,再难也要挺住;他们也坚信,只要坚持下来,疫情的寒冬一定会熬过去,春天终将到来。

其中一个阻碍便是坚持使用已过时的“拇指规则”(也叫经验法则),例如“ 按 70:30 的比例分割训练集和测试集”(70–30 train-test split)或大数据出现之前的黑暗时代遗留下来的方法。

研究者们入门数据科学世界时,意识到的第一件事便是,拥有训练和验证机器学习模型的独立数据集,至关重要。但是要实现这一点,很不容易。尽管我们对于为何要对数据集进行划分的背后有一个简单的直觉,然而深入理解这一困扰这个行业的问题,仍存在许多阻碍。

这为二手手机商家们带来了好消息。“做二手手机,标准是最重要的,只有建立一套大家都看得懂信服的标准,才能更好更快地实现交易。”在李女士的推荐下,徐子君对“采货侠”的质检标准已经研究了一周多时间,他感觉挺靠谱,也开始尝试在上面收货。

所有模型都是错的,但有些是有用的。

“买买买的市场有多大,卖卖卖的市场就有多大。未来中国二手交易市场将超过万亿规模,而线上化率的规模还会进一步扩大。”黄炜的判断,也得到了很多业内人士的认同。

与此同时,转转作为二手行业的头部平台,也在节后针对B2C业务对二手手机商家进行赋能,帮助优质商家在这个特殊的时期打通销路,共克时艰。

以前,华强北是二手手机商户、背包客、黄牛拿货的集散地,没想到,现在倒过来了,华强北的商户都要开始从二手电商平台拿货了。

在此基础上,美团外卖、美团闪购、美团买菜、快驴进货等和全国1000余个城市配送合作商一起,新增包括外卖骑手、司机、仓储员等20万个长期就业、灵活就业岗位。

当初,转转选择的切口是C2C,黄炜说,“中国的电商市场不缺B2C,现有的平台已经基本可以满足需求,但是缺少一个C2C平台。消费者的家里还有很多东西没有渠道可以卖出来,C2C是中国电商市场的最后一个机会。”

从二手手机业务本身看,今年春节以来线上二手手机交易确实也出现了持续增长的现象。

在此前的B2B业态里,由于没有统一的检测标准,也缺乏完善的质检服务,流通的货源品质参差不齐,没有达到质检标准的手机也依然在流通,交易双方的权益均无法得到可靠保障。“采货侠”的成立首先解决的就是统一质检标准,逐步完善线上交易链条,活跃二手手机线上交易。

随着获得更多的最优值,每一个部分做出贡献的机会就会增加。为了在不降低测试集和真实环境性能的情况下提升验证性能,要求提高验证性能的贡献只来自泛化特征部分。

当然,通过使用大型验证集可以减少验证集泄漏的风险,但我使用了小数据来进行训练和验证,即“波士顿的房价”数据集,为的是能够轻松地演示过度调整小的验证集的情况。

“往年正月十五,大家已经回深圳开店了。如今,门店已经大半个月没开张了,同在华强北做生意的几个朋友,拿不到货,都去朋友圈卖口罩和消毒液搞副业了。”但李女士并不着急,因为她找到了新的货源渠道,“很多区域的合作商问我能不能发货,只要快递通了的地方,我就能发。”

对此,转转联合创始人、副总裁相昌峰表示,“虽然我们一直在做C端的生意,但关于B端的讨论却一直存在,之前也多次跟CEO黄炜聊过B2B的事情,老板也看好这个方向。”

云模式助推IT行业缺口加大

其中,IT行业高居榜首。缺口最大,一方面能够解释其收入水平最高的现象,另一方面,受疫情影响,企业在线办公、政府大数据运用、居民在线消费等需求增加,在万物“云模式”下,亦加大了IT行业的缺口。

而从上述极光发布的报告数据看,转转的渗透率和DAU等数值,远超过同样以二手手机业务为主的其他垂直类平台。特别是2019年四季度转转再次引领二手电商打造“二手双11”,平台GMV较去年双11同比增长72%,其中二手手机已成为拉动增长的第一品类。

值得注意的是,即便是疫情给今年的春节假期带来一定影响,但转转平台自营手机业务的订单量和GMV仍较去年同期分别增长了56.9%和48.6%,新增用户的增长也达到了45.6%。

七成以上的二手手机交易仍在线下完成

上一次是从2月10日延迟到2月18日,这次,传闻是延迟到3月6日。

线上销售突破了地域和时空的限制,在这个特殊时期,不必接触就能把货卖出去。线上销售也大大降低了人力成本,解决了当下一些二手手机店员工在家中无法外出,人手不足的问题。随着快递物流行业逐渐复工,线上销售链条将得以正常运作。

相昌峰介绍,实际上这次突如其来的疫情对所有平台也都会有一定影响,但相比以线下门店为主、面临困境的垂直平台,头部平台的优势就在于除了巨大的流量加持外,还有相对稳定的货源,同时还可以提供服务。比如“采货侠”平台上目前的供货方,几乎都是大的商户和头部供应链企业,同时还有各地的主要渠道商。这些供货商相比中小商户,一方面货源更为可靠,另一方面在库存和资金上抗风险的能力也要更强,对于徐子君这样开门店的下游小商户来说,无疑是当下的“救命稻草”。但是从链路来看,以往徐子君是无法直接触碰到这些头部供货商的,但现在有了线上平台,他可以直接采货,去除了中间冗长的流转过程。

事实上,疫情发生以来,很多有实力有货源的商户,已经转战线上平台。

转战线上平台,显然已经成为一个非常重要的选择,且是必然趋势。

目前,手机品类是转转平台最核心的品类。早在2016年初,转转就率先在业内推出了验机质检,随后的2017年3月,将标准化服务延伸到了售后环节。截至目前,转转已经拥有1000人的质检工程师团队,针对手机验机质检从过去的51项质检标准升级为66大项,同时还针对C2C交易及自营交易提供相应的质保服务。服务上线后,转转的手机交易数据提升明显,平台手机订单中,选择验机的比例已经超过90%,甚至很多消费者在购买二手手机时,也会要求先走转转验机。

为了进一步减少塑料袋使用量,泰国零售业协会发起“每天向塑料袋说不”活动,加入协会的75个企业品牌共24500个销售网点,从2020年元旦起,将全面停止提供免费的一次性塑料袋,希望每年减少30%、也就是135亿个塑料袋使用量。

我认为部分原因是,“提问-回答”的思维定式仍然主导了我们的集体认知,例如“过度拟合验证数据”和“验证集泄漏信息”没有视觉或经验直觉的支持。

鱼宴尽情享,年货随意购。在洞头新城农贸市场,摆满了各式各样的年货,可谓是年味十足。

你可以怀疑这些结论是否适用于除我选择的特定数据集以外的其它数据集!我鼓励你提出自己的实验并分享你的结果。

需要注意的是:虽然损失可以根据数据和模型参数显式计算,但损失与模型超参数之间联系更不直接。如果你对此感到困惑,不妨回顾下生物学家使用适应度曲面( Fitness Landscapes)将繁殖成功作为遗传因素的函数。必要时你可将超参数函数(和数据)的损失和“模型适应度曲面”的损失,视作相同的。

58同城副总裁陈永胜则在接受媒体采访时表示,此次疫情将推动以互联网平台为基础的AI、VR、视频等线上新兴创新招聘渠道,进一步大幅提升视频招聘在面试渠道中使用的比例,更利于就业大数据的行业发展,加速供需双方的精准就业效率匹配。

另一个阻碍是:我们许多人在学习“除了测试集之外,我们还应该有一个独立验证集用于调整超参数”的过程中都会遇到一个问题:如果我们仅通过调整超参数就会导致测试集过拟合,那么就不会导致验证集过拟合吗?然而针对这一问题,研究者们还没有找到一个好的答案。

如果你熟悉机器学习,尤其是研究过神经网络和梯度下降算法,以及阅读过下面这篇关于梯度优化算法的(文中有丰富的可视化图片和动画)文章,那么你对损失曲面概念一定不陌生。

但根据36氪发布的《二手手机行业研究报告》显示,目前中国的二手手机交易的线上化率只有20%左右。也就是说,七成以上的二手手机交易仍在线下完成。

此外,“采货侠”平台的售后服务将由质检能力强、体系标准化的转转提供,品质有保障,让商家们的交易不再有后顾之忧。同时,疫情期间在商品的质检上,“采货侠”还将对商品进行质检、消毒和包装,也是保证交易安全,让买家更放心。

如图所示,当我们投入越多的精力用于优化超参数和根据验证集性能选择模型时,验证集和测试集之间的性能差距就越大。

换句话说,就是将每个超参数视为一个旋钮。我们要做的就是不断调整每个特定旋钮,直到找到最佳位置。

接下来进行一个关于梯度提升回归模型(Gradient Boosting Regression Model)上执行的调整量以及验证集和测试集性能之间的差距的快速实验。其中选择使用梯度提升算法的原因,是它是具有大量超参数的主流模型。

对于整个产业链条上的人来说,也需要在这样的艰难时刻,再坚持一下。昨日,李女士和丈夫就已经踏上返回深圳的旅途。

此外,在2月10日至2月14日这段假期延长、企业学校纷纷推迟复工、开学的时间里,转转自营手机的订单量增长环比前一周增长75.9,自营手机交易的GMV也实现环比107.2%的高速增长。

在云模式下,“云上课”“云卖房”“云卖车”“云发布会”等纷呈迭出。而种种“云”背后,恰是IT行业的支撑。甚至招聘本身亦在较大程度上转型为“云招聘”。

彼时,相昌峰表示,“采货侠”作为B2B二手交易平台,不仅可以为有回收能力的电商平台提供货源和渠道,还可以和B2C平台建立起有效的流转体系并提供相应服务,帮助B端商户高效流通品质货源的同时,让大家的生意更好做一些。

鲈鱼豆腐、姜丝猫耳、双丸合璧……“千鱼宴”上,百岛十二鲜纷纷亮相。用材上,以本地产的东海海鲜为主,配料较简单,不致喧宾夺主;加工上,以蒸煮为主,极少油炸,保持了海鲜的原味;营养上,以有食疗价值的海生物为主,在品鲜的同时起药膳的作用,有益于健康。

尽管我们通常将损失曲面视为模型参数函数,但也可将它们视为超参数函数。

“鳗香”年货集市采用线上线下结合的售卖模式,近百家年货售卖商户、小吃参与,年货质量优、品种全、价格惠。线下设立了鱼鲜专场,鲳鱼、带鱼、黄鱼、梭子蟹、对虾等海鲜一应俱全;洞头经典干货,羊栖菜、紫菜、鳗鱼干、虾干、墨鱼饼等产品“干货满满”;洞头优质吃货,白龙屿大黄鱼、星贝海苔、霓屿紫菜等品牌产品一一亮相。

这实际上是我第二次尝试解释超参数调整与验证集过拟合现象之间的关系。而难以置信的是,我们很难清楚地解释相对简单的潜在直觉想法。

具体而言,损失曲面就是将机器学习模型的损失或误差作为其参数的函数。

这也是华强北的销售状况被视作是中国手机市场的晴雨表的原因所在。

另据记者了解,在物流也受较大影响的当下,春节常规假期(7天长假)一结束,和顺丰长期合作的转转就开始发货,随着国内物流运力逐步恢复,2月7号开始除了湖北地区外,全国发货已基本恢复正常。

近百家年货售卖商户、小吃参与年货集市。洞头供图 

而从用户求职需求侧来说,2月全国求职数量前10的省(及直辖市)分别是广东省、山东省、江苏省、四川省、浙江省、湖南省、北京市、河南省、辽宁省及上海市。

第一期加入的供应商卖家是采货侠主动选择的,集中在广东地区,基本都是国内主要的供应链企业以及广东地区的主要渠道商,其中有几家当地大的商户还是李女士原来拿货的渠道商。

转转CEO黄炜在公司复工当天内部讲话时曾表示,受到疫情影响,今年初线下二手手机行业受到冲击较大,特别是中小商户,预计最快也要3月才能复工。“转转需要提前做点事,等到大家复工的时候,能真正帮到他们,只有大家的生意好做一些,整个行业才能抗住这波冲击,并在疫情过后获得爆发式发展的机会。

据悉,采货侠是转转联合线上二手回收平台闪回收以及柒月、壹品等国内头部供应链企业,共同投资成立的公司。其股东中还包括地方回收商和渠道商。

值得一提的是,58同城数据还显示,IT行业,金融业,文化、体育和娱乐业,房地产房地产业及居民服务、维修和其他服务业缺口依次排前5名。

更让商户看重的,是相比业内另一家平台收取高额佣金,采货侠平台目前对商户坚持采取0服务费的方式,更是给苦熬寒冬的商户们减轻了相当大的资金压力。

与此同时,招聘需求排名前10的职位,依次是普工、操作工、包装工、组装工、销售代表、装卸/搬运工、保安、快递员、服务员及送餐员。其中,由于口罩、消防服、消毒液如今已成刚需,相关制造业企业亦加足马力,由此普工需求量激增。

国内最大的二手手机集散地——华强北又一次推迟了开市的时间。

疫情之下,一方面医疗物资、防疫用品需求增大,另一方面,隔离在家的居民,其基本生活消费需求并未缩减,如各大生鲜平台的“爆火”便是最佳例证。

现在要意识到的关键是,每个数据集分区都会有独立的损失曲面,而训练集、验证集和测试集的损失曲面完全不同。如果数据已经被很好地分割,那么每一组数据就都是一个有代表性但不相同的样本。

极光报告分析认为,开始布局2B业务,同时迅速吸引到业内头部企业加盟,转转已建立起二手手机产业壁垒,形成竞争优势。

58同城的数据显示,从招聘需求侧来看,排名前十的城市分别为深圳、东莞、北京、重庆、成都、广州、上海、郑州、长沙、杭州。上述城市,均属于一线城市或新一线城市。其中,珠三角、长三角和成渝地区招聘需求量大,而中部重镇武汉,由于受疫情影响,大部分企业并未复工,未能进入前10名。

损失曲面是可以通过梯度下降或其他方法(例如模拟退火、演化方法)进行遍历的函数。即使你要处理的函数通常位于高维空间中, 这样命名让我们不由得根据物理直觉来思考它。

首先,“采货侠”节后再一次针对商户扩大开放范围,由年前的广东省扩大至如今的全国范围,且由采货侠平台提供验机服务。相昌峰透露,面向全国开放商户入驻的计划确实因为疫情而提前,目前只要符合平台S\A\B\C的标准的二手手机,均可发布流通。作为一个开放的B2B线上交易平台,“采货侠”大大弥补了疫情之下通讯市场延迟开门的损失,且更安全,响应了当下防疫工作的需要。

比如在2017年11月的闲鱼战略发布会上,闲鱼总经理谌伟业也曾说过,闲鱼要成为继淘宝、天猫之后,阿里的第三大平台。

一种考虑超参数调整的方法是,将遍历验证集数据的损失曲面作为超参数函数。让我们从假设一个“理想”曲面来开始建立直觉。

雷锋网原创文章,。详情见转载须知。

根据第三方数据公司QuestMobile2月12日发布的《2020中国移动互联网“战疫”专题报告》,从1月24日至2月2日,盒马、叮咚买菜、每日优鲜的日活跃用户规模增速均超过100%;而多点Dmall、京东到家的日活跃用户规模也获得了双位数的增速。

根据泰国污染控制局的统计,泰国每年用掉450亿个塑料袋,其中4成、约180亿个塑料袋来自传统市场或是街头小贩;其中3成、约135亿个来自零售业者;还有3成来自超市和百货公司。

推广:猎云银企贷,专注企业债权融资服务。比银行更懂你,比你更懂银行,详情咨询微信:zhangbiner870616,目前仅开通京津冀地区服务。

此前,转转的交易模式主要有两个,分别为C2C和C2B2C。而新成立的采货侠平台,却发力B2B市场,究竟是为何?

最重要的是,所有现有数据的损失曲面与真实环境中的潜在“总体”数据的损失曲面不同。我们之所以同时需要验证集和测试集,是因为如果随着时间的推移验证集确实泄漏了信息,那么我们仍需要一些数据来无偏估计模型在真实环境中的性能。

最突出的是手机的货源问题,当下,线下市场推迟开业,商户们回不去,也拿不到货,即使有客户要货,都很难寻找到合适的解决方案。

收到这个消息时,在深圳华强通天地电子市场做了十多年二手手机生意的李女士,还被困在安徽老家。

美团方面相关数据显示,自2020年1月20日到2月23日,美团外卖配送平台新招聘7.5万个外卖骑手,其中一半以上在本省就近就业,六成以上来自工厂工人和服务业从业者。

采货侠的出现,对于整个行业来说,无疑是一大利好。

之所以二手交易最后被挖掘,是因为难度很大。黄炜分析说,“C2C电商的供给端是分散的C端用户。最初,淘宝二手也是从C2C开始做,但是后来发现还是B2C更好做。”基于此,转转上线之初,就要直面二手手机行业内的一大痛点——如何积累两个C端用户之间的信任,这是一个完全不一样的游戏规则。

大多数人不知道,二手手机的市场有多庞大。根据IDC最新发布的《2019-2023年全球二手智能手机预测》,2019年二手智能机的出货量达到2.06亿台,增长速度高达17.6%;2023年,这个数字更会达到3.33亿台,复合增长高达13.6%。

我希望这是思考验证集过度拟合背后机制的一种有用方法。

在展示最终结果之前,需要提前说明一件重要的事:这个实验可能偏向于支持我的论点:

这类的损失曲面之所以理想,是因为在处理它们时,可以将调整许多超参数的问题分解为一次单独调整一个超参数。由于任意一个超参数的最佳值与其他超参数无关,因此我们可以按顺序而不是并行地进行超参数调整。

三、“弄脏”我们的手:模拟验证集泄漏

此外,就上述10大职业来看,快递员、服务员及送餐员等均属于零工经济的一部分。其需求量之大,从美团的相关数据中亦可以窥见一二。

就像这样!这就是验证集会变得过时和泄漏信息的原因,或者至少是一种有用的思考方式。

2019年3月,转转发布的《2018年度转转二手交易服务白皮书》中曾首次批露平台年度服务数据。这份报告显示,2018年转转平台总用户数已超过2亿,App和小程序的月活用户数突破5000万,年度订单量实现翻倍以上增长,平台年度整体二手业务已覆盖全国564个城市。

然而在对样本数据的划分上,往往受限于一些过时的规则以及思维定式的限制,在划分验证集以及解决验证集目前存在的一些问题上,面临着比较大的阻碍。

实际上,我们已经看到,无论是国家层面,还是企业,亦或是每个个体,在全民抗“疫”的同时,也在积极恢复生产,参与推动生产经营和生活慢慢回到正轨。

对于不少二手商户来说,线下市场开市时间延迟,不仅意味着收入要大打折扣,更意味着他们还要承担市场租赁费带来的巨大压力。“从目前看,整个2月份基本都打水漂了,流动资金严重不足,货又被积压着,真的很难。”同为华强北商户的徐子君是深圳本地人,他的货都在市场里,生意没法做,面临着资金链断裂的压力。

几年来的发展也证明,在二手电商行业,转转和闲鱼成为仅有的两家头部平台。极光最新发布的《2019年Q4移动互联网行业数据研究报告》也指出,国内二手电商已形成腾讯和阿里两大生态阵营,其中转转和闲鱼占据了90%以上的市场份额。

与此同时,疫情之下,“云上课”“云卖房”“云卖车”“云发布会”“云演唱会”,甚至“云蹦迪”“云喝酒”“云睡觉”……似乎日常生活的诸多面向均步入“云时代”,信息传输、软件和信息技术服务业(简称“IT行业”)的招聘需求也较为旺盛。58同城方面的数据显示,IT行业成为最“缺人”的行业。

批发和零售业招聘需求最高

除“鳗香”年货集市、“千鱼宴”之百岛十二鲜活动外,百岛年货节还推出了百岛“千鱼宴”之海鲜火锅季、百岛洞头·年货之旅和“挥春迎新·百岛纳福”送春联等配套活动。来自全国各地的年货、小吃也汇聚洞头,为年货节“呐喊助威”。

2019年11月刚成立的一个B2B二手交易平台“采货侠”,在这个特殊时期解决了李女士的难题。

“千鱼宴”之百岛十二鲜纷纷亮相。洞头供图 

作为数据科学家,我们不能不通过实验就阐述一个观点。要求超参数之间没有任何交互作用,是过于严格的。尽管这对于开发心理模型很有用,但最好有一些经验结果表明这种想法能扩展到没那么理想的场景。

当我们根据验证集数据每次都将旋钮调至最佳值后,会发生什么呢?

这就是变得有趣的地方:回想一下,每个数据集都有自己的损失曲面。现在想象在调节的每个旋钮之后叠加这些函数的投影。然后让我们选择用于确定最佳超参数值的验证数据的损失曲面,和全部总体数据的假设损失曲面,它是我们期望的模型最优结果,也是测试集的估计(如果采样正确)。

据悉,这75个企业包括经营泰国7-ELEVEn(7-11)的卜蜂集团、尚泰百货集团、The Mall百货集团、福联超市、特易购莲花集团、罗宾森百货、全家、屈臣氏、Big C Supercenter Plc等知名的零售百货或超市业者。

作为反馈,在这里向大家提出以下问题:如果你要优化的一个超参数实际上不能从数据(例如 random_state)中学习泛化特征,针对这种情况优化验证损失会产生什么影响?

很高兴看到数据社区提出一些其它想法!   雷锋网(公众号:雷锋网)雷锋网雷锋网

2015年11月12日,转转正式推出,黄炜回忆,“之所以选在双十一后的第二天,前一天买买买买,后一天卖卖卖。”

对于理想的损失曲面,超参数当然是“独立的”,意思是超参数与损失的之间没有相互作用项。这类函数的等高线不会对角突出,如下图所示:

可能的结果是验证集和“总体”损失曲面不太一致。当每次我们调整一个超参数值使验证集的损失曲面达到峰值时,我们可能已经越过“总体”损失曲面的峰值。调整得越多,越过的峰值就越多。这将导致验证集和实际性能(由测试集估计)之间的差距越来越大。

尽管本文是为了更深入、更初级的解释超参数调整和过拟合验证集之间的关系,但我们仍有更多角度空间和思考方式。 Cassie Kozyrkov 最近发布了一篇文章,将教学和《憨豆先生》进行类比,对数据集分割进行了有趣的论述:

如华为、顺丰、链家等企业均采用视频招聘形式。一名南京应届毕业生亦对《每日经济新闻》记者表示,如今大多数面试主要通过视频形式。

值得一提的是,在云招聘过程中,直播亦开始展露锋芒。记者了解到,今年北京大学的春季招聘宣讲会即通过快手直播的形式开展。

为了回答这个问题,考虑单个超参数的验证性能。现在,将目标函数的每个值都视为获得了来自泛化特征和验证集数据异常的贡献。

根据我们对验证集泄漏的理解,我们期望的结果是:随着调整的增加,验证集和测试集之间的性能差距将不断扩大。在实验中,“更多的”调整定义为通过5个不同的超参数进行更多次的随机搜索迭代。迭代次数越多,就越有可能在验证集上找到更理想的结果。如果心理模型的部分最优值真的来自非泛化的验证数据异常,那么我们期望在测试数据上不要出现这种性能提升。

如果我们已经调优了一个超参数子集,然后再调优另一个超参数集,或者尝试切换使用的模型族,验证集和测试集间的性能差距会更加显著。根据数据样本(验证集)做出的每个决策,都会将该样本的随机波动缓慢地编码到结果中。

转转CEO黄炜曾预测,未来二手手机线上化率有望达到30%甚至更高。这场突如其来的疫情,显然会催化更多的线下从业者转战线上,从而更快推动线上二手手机交易的发展。

如果你觉得这个概念过于简单而不必特别关注,我十分能理解。尽管你已经理解了相关基本概念,但“损失曲面”实际上是这类函数的名称,知道它后你可以轻松查阅各种有趣的内容和相关研究。

二手交易平台转转的数据就显示,1月25至1月31日春节假期期间,转转平台二手手机的交易订单量环比春节前一周增长了75.6%,二手手机GMV环比增长49.9%,二手手机交易验机服务用户增长达到了133%。

对此,他提出用心理模型来改善验证集当前的困局。

在这里,特别细心的读者可能会问:“如果验证和总体损失曲面没有全部重合,那为什么峰值的重合要少于其他点的重合呢?”这是一个很好的问题,并且开始测试我们开发的心理模型的局限性。

通过“优选商铺”入口,转转将对优质商家进行流量、营销、运营等多个角度进行赋能,商家可通过OPO店铺进入,完成商品的流通。

本文首先将探讨损失曲面(Loss Landscapes)的概念,以及如何利用样本曲面与总体曲面之间的关系理解验证集泄漏。在此过程中,将基于一些简化的假设来开发有用的心理模型(Mental Model )。最后,将通过一个快速的实验来验证我们的理解。

可以说,华强北不开市,有100多万从业者的二手手机产业都会受到影响。

此外,记者了解到,目前诸多知名企业均采取线上招聘的方式,如华为、顺丰、链家等企业均采用视频招聘形式。包括北大等知名高校甚至采用直播等形式开展线上宣讲。

从整个手机通讯行业看,不少手机厂商已将目光投向了线上渠道。2月13日,小米10新品发布会采用了“纯线上直播”的方式;荣耀、红魔也陆续发布声明,表示将举行线上的新品发布会;另外三星Galaxy S20系列新品发布会预计也将采用线上直播形式。

从招聘行业与岗位来看,招聘需求位列前三位的分别是批发和零售业、制造业与IT行业。

据悉,此次活动从1月3日起一直持续至1月9日,还设置了红包和优惠券大派送。活动前3天每日都有500个奖品送出,其中购物券最高价值588元,还有洞头特色商品礼盒、夜光杯三件套、商家抵扣券等暖心福利。(完)

“我们从2月1日开始就和平台上大的渠道商和供货商保持高频的沟通,了解他们库存等情况,同时做好应对的准备。”相昌峰介绍,在了解到上下游中小商户面临货源、资金等切实问题后,“采货侠”还出台了一系列新规,帮助商家渡过难关。

传统二手手机市场中,线下交易虽然占比大,但也存在巨大的困局。一方面,线下交易流通环节众多,从二手手机回收商到各级经销商,经手环节越多,销售终端成本也就越高,利润空间严重缩水;另一方面,二手手机行业尚未存在一个统一的质检标准,各店铺自己说了算,也让线上发展频频受阻。

2月26日,《每日经济新闻》记者从58同城招聘研究院方面获悉,2月3日-19日,就招聘需求端而言,深圳排名全国第一,批发和零售业招聘需求最高,普通岗位人才最受青睐。

归根结底,我们在此讨论的是一个心理模型,正如 George Box 的著名格言所说的:

二、面向心理模型:假设独立的超参数

而这次突如其来的疫情,就像一个放大镜,将这些二手手机产业链条中冗长的线下交易的弊端放大。

然后关联每个旋钮,就可以得到损失曲面的投影。我们的这部分函数将只有一个自变量:正在不断调整的超参数。

数据科学家 Ray Heberer 专门撰写了一篇文章来介绍验证集目前存在的一些问题,并表达了自己的看法:验证集如今变得不再有新意。

2019年12月26日,二手手机行业的重要玩家找靓机也投资入股,正式加入转转旗下的采货侠B2B联盟。

从行业收入水平来看,IT行业企业支付薪酬最高,达6921元;交通运输、仓储和邮政业,文化体育和娱乐业,居民服务、修理和其他服务业紧随其后,分别为6646元、6399元和6370元。